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本 书 由 统计 学 领域 著名 专家 所 著 ， 从 基本 的 金融 数据 出 发 ， 讨 论 了 这 些 数 据 的 汇总 统计 和 相关 的 可 视 化 
方法 ， 之 后 分 别 介 绍 了 商业 、 金 融和 经 济 领域 中 的 基本 时 间 序 列 分 析 和 计量 经 济 模型 。 作 者 通过 实际 操作 的 
方法 介绍 金融 数据 分 析 ， 选 择 使 用 免费 的 R 软 件 和 实际 案例 来 展示 书 中 所 讨论 方法 的 实现 。 书 中 抽象 理论 和 
实际 应 用 并 重 ， 读 者 既 能 从 中 轻松 学 习 金 融 计 量 模型 ， 也 能 了 解 它 们 在 现实 世界 中 的 丰富 应 用 。 

贯通 全 书 ， 各 章节 通过 R 图 形 以 可 视 化 的 形式 把 讨论 主题 展现 给 读者 ， 并 以 两 个 详细 案例 展示 了 金融 中 
统计 学 的 应 用 。 本 书 有 配套 的 网 站 ( http://faculty.chicagobooth.edu/ruey.tsay/teaching/introTS ) ， 其 中 包 
含 了 书 中 涉及 的 R 代 码 和 额外 的 数据 集 供 读 者 下 载 ， 通 过 这 些 读 者 可 以 创建 自己 的 模拟 分 析 ， 并 检验 对 本 书 
介绍 的 方法 的 理解 程度 。 

本 书 是 高 年 级 本 科 生 或 研究 生 学 习 时 间 序 列 分 析 和 商务 统计 学 的 优秀 入 门 教材 。 对 于 希望 进一步 加 强 对 
金融 数据 和 当今 金融 市 场 理 解 的 研究 人 员 以 及 商业 、 金 融和 经 济 领域 的 从 业者 ， 该 书 也 是 极 佳 的 参考 书 。 
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本 书 向 读者 展示 了 可 视 化 金融 数据 的 基本 概念 ， 共 有 7 章 内 容 ， 涉 及 有 软件、 线性 时 间 序 列 分 析 、 资 
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伟大 的 统计 学 家 George Box 有 一 句 名 言 :“ 所 有 的 模型 都 是 错误 的 ， 但 其 中 有 一 些 是 
有 用 的 .” 这 人 句 话 给 出 了 现实 中 统计 模型 的 现状 . 现实 中 不 确定 性 无 处 不 在 ， 确 定性 “下 
确 ” 模 型 是 不 存在 的 ， 如果 Box 在 现在 这 个 时 代 ， 他 可 能 会 增加 一 名 “并且 其 中 一 些 模 
型 是 危险 的 ”>， 尤 其 对 于 金融 领域 的 一 些 模型 . 2008 年 的 金融 危机 ， 在 某 种 程度 上 是 由 错 
误 的 金融 模型 造成 的 ， 既 有 模型 过 于 简单 的 原因 又 有 模型 过 于 复杂 的 原因 . 房地产 经 纪 
人 和 买 家 依赖 于 一 个 隐 式 模型 ， 它 表明 价格 已 经 在 高 位 ， 并 且 还 会 继续 上 涨 ， 贷 款 人 使 
用 统计 模型 来 对 打包 的 按揭 产品 进行 分 析 设 计 ， 这 似乎 可 以 奇迹 般 地 降低 风险 . 然而 最 
后 的 结果 是 灾难 性 的 , 在 5 年 之 后 仍然 可 以 感受 到 房地产 泡沫 的 影响 . 

因此 ， 如 何 进行 有 用 的 并 且 没 有 危险 的 金融 分 析 呢 ?首先 应 该 对 金融 数据 有 一 个 基 
本 的 理解 ， 尤 其 是 时 间 序 列 数 据 ， 因 为 不 确定 性 是 主要 的 影响 因素 ， 例如， 可 以 应 用 概 
率 模 型 来 描述 资产 收益 率 的 频率 分 布 ， 本 书 给 出 了 大 量 的 时 间 序 列 模型 ， 它们 可 以 对 数 
He EAT ts. OR er AE To a 

要 成 为 一 个 统计 分 析 专 家 ， 没 有 对 实际 数据 的 分 析 经 验 是 绝 不 可 能 的 . 2X Fm M BL RZ 
在 本 书 中 给 出 了 进行 实际 数据 分 析 所 需 的 数据 和 统计 工具 这 里 的 统计 分 析 工 具 是 R 软 
件 ， 它 是 一 款 开 源 的 统计 软件 包 ， 可 以 和 现在 的 商业 软件 包 媲 美 . R 软件 功能 强大 ， 免 
费 并 且 有 数 千 个 用 于 完成 特定 任务 的 添加 包 . 化 教授 在 书 中 给 出 了 金融 数据 分 析 的 几 个 
关键 添加 包 . 通过 本 书 提 供 的 数据 集 ， 你 就 可 以 应 用 R 软件 来 学 习 金 融 时 间 序 列 的 实际 


应 用 . 
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2013 年 6 月 17 日 
美国 统计 教育 学 院 ，Statistics. com 在 线 课程 网 站 总 裁 Peter Bruce 









































Recommendation Preface 


The great statistician George Box famously said “All models are wrong, but some 


are useful. ” This statement embodies the statistical approach to reality, in which uncer- 





tainty is everpresent, and a deterministic “truth” does not exist. Box might now add 
“and some models are dangerous” particularly those in the financial arena. The financial 
collapse of 2008 was caused, in part, by faulty financial models, both at a simple and a 
complex level. Real estate brokers and buyers relied upon an implicit model that said that 
prices have been going up, so they will continue to go up. Lenders used statistical models 
to engineer bundled mortgage products that magically seemed to reduce risk. The result 
was a disastrous real estate bubble whose effects were still being felt half a decade later. 

So how do you conduct a financial analysis that is useful, and not dangerous? The 
first thing to focus on is a basic understanding of financial data-particularly time series 
data. Since uncertainty plays a large role, probabilistic models are used, for example, to 
portray the frequency distribution of asset returns. There are a number of time series mod- 
els that describe, smooth, and seasonally adjust the data. 

Expertise in statistical analysis cannot be obtained without getting the hands dirty in 
actual data and analysis. Ruey Tsay provides both the data and the statistical tool you will 
need to get your hands dirty. The tool is R-the popular open-source statistical software 
that is now on a par with commercial programs. It is powerful, free and has spawned the 
creation of thousands of R “packages” to accomplish specific tasks. Tsay provides pointers 
to some of the key packages for financial analysis. Together with the datasets provided in 


the book, you are equipped to learn the practical application of financial time series 
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using R. 
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本 书 是 原作 者 继 《Analysis of Financial Time Series》 之 后 的 又 一 本 力作 .由 于 金融 
计量 学 和 人 金融 统计 变 得 越 来 越 重 要 ， 所 以 读者 很 过 切 地 需要 这 方面 的 资料 ， 而 国内 相关 
的 教材 目前 还 比较 少 ， 机 械 工 业 出 版 社 及 时 引进 了 《金融 数据 分 析 导 论 》 的 中 文 版 权 ， 
使 得 国内 读者 能 够 几乎 和 国外 同步 地 学 习 该 书 的 内 容 . 

本 书 应 用 开源 的 R 软件 ， 结 合 具 体 的 金融 数据 来 讲解 金融 数据 的 分 析 方 法 和 模型 . 
第 1 章 首 先 癌 谈 者 展示 了 可 视 化 金融 数据 的 基本 概念 、 金 融 计 量 模型 和 它们 在 现实 世界 中 
的 丰富 应 用 . 第 2 章 从 线性 时 间 序 列 模型 开始 ， 介 绍 常 见 的 金融 数据 分 析 模 型 ， 第 3 章 介 
绍 了 3 个 金融 数据 分 析 的 实际 宁 例 ， 读 者 可 以 从 中 学 习 线 性 时 间 序 列 檬 型 在 实际 中 的 应 
H. 第 4 划 介 绍 了 波动 率 模 型 .第 5 间 介 绍 波动 率 模 型 在 金融 中 的 实际 应 用 . 第 6 草 介 绍 
如 何 处 理 高 频 金 融 数 据 . 第 7 草 介 绍 用 量化 方法 进行 风险 管理 ， 包 括 风 险 值 和 条 件 风 
or {EL 

对 于 实际 的 金融 数据 案例 ， 本 书 应 用 免费 的 R 软件 给 出 了 具体 的 分 析 过 程 和 R 代码 . 
读者 可 以 按照 书 中 的 讲授 ， 一步 一 步 地 进行 实践 ， 加 深 对 本 书 内 容 的 理解 . 

在 本 书 的 翻译 过 程 中 ， 我们 得 到 了 蔡 瑞 胸 教 授 的 帮助 ， 他 帮助 译 者 港 清 了 一 些 问 题 . 
中 文 版 对 原 书 中 发 现 的 错误 进行 了 相应 的 更 正 .， 本 书 第 1 章 、 第 3 音 和 第 5 章 由 尚 秀 分 翻 
译 , 第 2 章 、 第 4 草 、 第 6 草 、 第 7 和 草 由 李 洪 成 完成 ， 其 中 部 瑞丽 协助 翻译 了 第 2 草 的 部 
TAR. 全 书 由 李 洪 成 进行 统一 定稿 ， 本 书 的 责任 编辑 盛 思源 为 本 书 的 出 版 付出 了 大 量 
的 劳动 ， 由 于 她 的 认真 校对 和 修订 ， 本 书 才能 及 时 得 以 出 版 ， 男 外 ， 特 别 感谢 明永 玲 编 
辑 对 本 书 翻 详 工 作 的 大 力 文 持 和 帮助 . 本 书 的 翻 详 还 得 到 了 上 海 金融 学 院 的 领导 和 同事 
的 帮助 和 文 持 ， 在 此 一 并 表示 衷心 的 感谢 ， 由 于 时 间 人 仓促 ， 加 之 本 人 的 精力 和 水 平 有 限 ， 
翻译 不 当 之 处 在 所 难免 ， 请 读者 和 同行 指正 . 
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我 经 常会 被 读者 问 到 有 关 人 金融 时 间 序 列 分 析 的 问题 ， 你 能 否 让 金融 数据 分 析 更 简单 
些 ? 我 也 经 党 被 我 的 学 生 问 道 : 如 何人 简化 实证 研究 工作 ,统计 学 和 金融 学 究 驶 存在 怎样 
的 关系? 这些 都 是 很 重要 的 问题 ， 它 们 促使 我 编写 这 本 入 门 教材 . 

为 了 简化 实证 数据 分 析 ， 我 决定 使 用 及 软件 进行 所 有 的 分 析 . 这 样 做 是 基于 下 面 几 
个 原因 . 第 一 ，R 软件 在 大 多 数 平 台 上 都 能 免费 使 用 ， 第 二 ， 已 有 许多 研究 人 员 针 对 金 
融 数据 开发 出 很 好 的 软件 包 ， 尤 其 是 RMetrics 提供 了 许多 有 用 的 软件 包 . 第 三 ，R 软件 
添加 包 的 功能 正在 飞速 增加 ， 并 且 这 种 趋势 还 会 继续 下 去 .第 四 ， 我 写 过 一 些 简 单 的 R 
代码 ， 用 以 在 某 些 场合 展示 某 些 具体 分 析 方 法 这些 代 码 起 两 个 作用 . 其 一 ， 它们 能 满 
足 我 展示 概念 和 方法 的 特殊 需要 . 其 二 ， 更 重要 的 是 ， 读 者 只 要 稍 有 一 些 R 软件 的 使 用 
经 验 丈 可 以 简单 地 修改 这 些 代 码 和 命令 以 适应 他 们 的 需要 ， 从 而 简化 他 们 的 金融 数据 分 
人 

为 了 使 计量 经 济 学 和 统计 学 的 理论 更 简单 易 必 ,我 尝试 以 一 种 简洁 的 方法 来 讲解 ， 
并 应 用 大 量 实际 案例 来 阐释 这 些 内 容 ， 本 书 共 有 7 章 ， 其 中 两 章 为 案例 分 析 .， 这 两 章 的 案 
例 揭示 了 统计 和 学 与 金融 学 之 间 的 联系 . 其余 章节 用 来 帮助 读者 理解 概念 ， 获 取 金 融 数据 
分 析 的 经 验 . 第 1 半 介 绍 金 融 数据 ， 并 讨论 了 汇总 统计 量 和 数据 可 视 化 的 知识 . 此外， 还 
介绍 了 R 软 件 ， 这 样 恋 者 就 可 以 应 用 它 来 探索 金融 数据 ,第 2 章 介 绍 线性 时 间 序 列 分 析 
的 基本 内 容 ， 涵 盖 了 商业 、 金 融和 经 济 学 中 常用 的 一 些 人 简单 计量 经 济 模型 ,在 保持 行文 
简洁 的 同时 ， 我 尝试 使 该 革 内 容 尽 量 全 面 .该 革 还 介绍 了 指数 平滑 预测 法 和 模型 比较 方 
法 . 第 3 章 介 绍 了 3 个 案例 学 习 (case study). 其 中 使 用 的 模型 并 不 简单 ， 但 是 它们 可 以 
帮助 读者 理解 线性 时 间 序 列 模 型 在 实际 应 用 中 的 价值 和 局 限 性 . 第 4 章 介绍 资产 波动 率 的 
不 同 计算 方 法 ， 以 及 多 种 波动 率 模 型 ， 其 中 讨论 的 方法 包括 应 用 日 开盘 价 、 收 盘 价 、 最 
高 价 和 最 低 价 的 方法 ， 同样， 我 尝试 使 该 革 的 内 容 尽 量 全 面 ， 同 时 避免 过 多 的 理论 细 市 . 
第 5 章 介 绍 波动 率 模型 在 金融 中 的 实际 应 用 .该 章 旨 在 帮助 读者 更 好 地 理解 波动 率 的 期 限 
结构 ， 以 及 波动 率 在 金融 实践 中 的 应 用 ， 第 6 章 介绍 如 何 处 理 高 频 金 融 数据 ， 包 括 价格 变 
动 、 交 易 强 度 以 及 实际 波动 座 的 简单 榨 型 .最 后 ,第 7 章 介 绍 用 量化 方法 进行 风险 管理 ， 
包括 风险 值 和 条 件 风 险 值 . 该 章 洱 将 风险 评估 的 重要 计量 经 济 学 方法 和 统计 学 方法 ， 包 
含 基 于 极 值 理论 和 分 位 数 回归 的 一 些 方法 . 

本 书包 含 许多 图 表 和 示例 ， 它 们 吕 在 简化 金融 数据 分 析 的 过 程 ， 使 结果 容易 理解 . 
限于 坊 幅 ， 不 可 避免 地 省 略 了 一 些 重 要 内 容 . 本 书 洱 兰 的 内 容 与 《Analysis of Financial 
Time Series》 一 书 有 部 分 重合 ,但 是 本 书 所 用 到 的 案例 部 是 全 新 的 . 

首 此 机 会 ， 我 感谢 我 的 妻子 . 如 果 没 有 她 的 关心 和 帮助 ， 本 书 就 无 法 完成 ， 同 时 我 
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第 1 章 金融 数据 及 其 特征 


近年 来 ， 数 量 分 析 方 法 在 商业 和 金融 市 场 上 的 重要 性 持续 增加 ， 因 为 我 们 有 丰富 的 数 
据 环境 ， 经 济 和 人 金融 市 场 的 数据 比 以 前 更 加 综合 和 完整 . 在 许多 国家 ， 成 百 上 于 个 变量 的 
数据 可 以 更 系统 、 更 精确 地 搜集 ， 计 算 处 理 上 的 便利 和 统计 软件 包 的 使 用 使 得 对 复杂 的 高 
维 金融 数据 的 分 析 成 为 可 能 . 通过 互联 网 ， 人 们 可 以 很 容易 地 应 用 开源 软件 包 下 载 公开 的 
金融 数据 ， 比 如 了 软件， 所 有 这 些 软件 的 特性 和 功能 免费 公开 ， 因 而 被 广泛 使 用 . 

该 书 的 目的 是 提供 金融 时 间 序 列 分 析 的 基本 知识 ， 介 绍 分 析 金 融 数 据 的 各 种 统计 工 
具 ， 获 得 各 种 计量 经 济 学 方法 的 金融 数据 应 用 经 验 . 第 1 章 ， 我们 首先 分 析 了 本 书 有 关 的 
基本 概念 ， 通 过 实例 引入 了 R 软件 . 接 下 来 ， 我们 讨论 R 软件 中 用 不 同 的 方法 可 视 化 这 些 
金融 数据 .第 2 章 回 硕 了 非 线 性 时 间 序 列 的 基本 概念 ， 如 平稳 性 和 自 相 关 函 数 ， 介 绍 人 处理 
数据 中 序列 依存 关系 的 简单 的 线性 模型 . 随后， 讨论 具有 时 间 序 列 误差 的 回归 模型 、 季 市 
性 调整 以 及 单位 根 的 非 平稳 性 和 长 期 记忆 的 过 程 。 本章 还 讨论 了 用 指数 平滑 法 进行 预测 以 
及 不 同 模型 之 间 的 比较 . 第 3 章 对 第 2 章 介 绍 的 模型 进行 具体 应 用 ， 给 出 一 些 案例 学 习 ， 
有 助 于 帮助 读者 更 好 地 了 解 和 分 析 金 融 数据 、 实 证 模型 以 及 进行 统计 推断， 同时 也 指出 了 
线性 时 间 序 列 模型 在 长 期 预测 中 的 局 限 性 . 第 4 章 主要 讨论 条 件 异 方差 模型 的 建 模 ( 即 资产 
收益 率 的 条 件 方差 ;， 前 和 完 介 绍 刻画 资产 波动 率 随 时 间 演 变 的 计量 经 济 模型 . 本草 还 讨论 
了 不 同 的 波动 率 模 型 的 其 他 蔡 代 方法 ， 包括 使 用 资产 的 每 日 最 高 及 最 低 价格 来 建 模 . 第 5 
章 演 示 了 不 同 波动 率 模 型 的 应 用 ， 使 用 一 些 案 例 学 习 ， 给 出 波动 率 模 型 的 建 模 步 又 和 过 
程 ， 并 对 各 种 波动 率 模型 的 优 缺 点 进行 讨论 ， 包 括 扩 散 限 制 的 连续 时 间 模 型 第 6 章 是 关 
于 高 频 金 融 数 据 的 分 析 的 . 首先 给 出 了 高 频数 据 的 特性 ， 分 析 高 频数 据 相 应 的 模型 和 方 
法 ， 应 用 非 同 步 交 易 和 竞价 反弹 策略 来 研究 股票 收益 率 之 间 的 序列 相关 问题 . 此 外 ， 还 研 
究 了 交易 间隔 时 间 的 动态 性 和 分 析 交 易 数 据 的 计量 经 济 模型 . 特别 地 ， 我 们 讨论 了 应 用 逮 
辑 线性 回归 模型 和 概率 模型 (probit model) 来 分 析 股 票 价格 在 连续 交易 中 的 运动 过 程 . 最 
后 ， 使 用 日 内 对 数 收 益 率 数据 来 研究 实际 波动 率 . 第 7 章 讨 论 金融 头 才 的 风险 度量 及 其 在 
风险 管理 中 的 应 用 ， 引 入 了 风险 值 和 条 件 风 险 值 来 量化 在 金融 头寸 持 有 期 间 的 各 种 风险 ， 
包括 RiskMetrics 模型 、 极 值 理论 、 分 位 数 回 归 以 及 冰 值 峰值 理论 . 

本 书 非 党 重视 模型 的 应 用 和 实证 分 析 ， 每 章 都 包含 了 很 多 实际 的 例子 .在 很 多 时 候 ， 
金融 时 间 序 列 的 经 验 特征 是 计量 经 济 模型 发 展 的 动因 .对 某 些 案例 ， 本 书 网 站 上 给 出 了 某 
些 具体 分 析 的 简单 R 脚本 .每 章 后 面 的 习题 都 给 出 了 一 些 真实 的 数据 可 供 使 用 . 


1.1 资产 收益 率 


大 多 数 金 融 研 究 都 是 针对 资产 收益 率 ， 而 不 是 质 产 价格 .Campbell 等 (1997) 给 出 了 使 
用 资产 收益 率 的 两 个 主要 原因 ， 首 先 ， 对 于 一 个 普通 的 投资 者 来 说 ， 资 产 收益 率 代表 一 个 
完全 的 、 尺 度 自由 的 投资 机 会 的 总 结 和 概括 其次， 资产 收益 率 序 列 比 价格 序列 更 容易 处 
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理 ， 前 者 有 更 好 的 统计 特性 . 然而 ， 资 产 收益 率 有 多 种 不 同 的 定义 . 

i P, 是 t 时 刻 的 资产 价格 ， 下 面 给 出 本 书 中 用 到 的 一 些 资产 收益 率 的 定义 .暂时 假定 
该 过 程 资 产 不 支付 红利 . 

单 期 简单 收益 率 

假设 投资 者 在 一 个 周期 内 拥有 某 种 资产 ， 从 第 :一 1 天 到 第 上 天 ， 其 简单 毛 收益 率 为 : 
P, 
Pa 
相对 应 的 单 期 简单 净 收 益 率 (Simple net return) 或 简单 收益 率 (simple return) 为: 
ge Se 
P Paa 

K 1-1 给 出 了 2011 年 12 月 苹果 公司 股票 每 日 收盘 价 ， 从 表 1-1 中 可 知 ， 从 2011 年 12 
月 8 日 到 12 月 9 日 ,， 持 有 苹果 公司 股票 每 日 的 总 收益 率 为 1+ R, = 393. 62/390. 66 ~ 
1.0076. 相应 的 每 日 简单 收益 率 为 0.76%， 即 (393. 62 一 390. 66)/390. 66=0. 76%. 








] 十 上, = ARP, = P..+R,) (1-1) 
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多 期 简单 收益 率 
假设 从 第 tk 天 到 第 1 天 ， 这 个 周期 内 持 有 某 种 资产 ， 则 期 简单 毛 收 益 率 为 : 
| es — P Ps P ip 
1+ RLk| “me | p =s as P 


mR, we (1 + R, ,1) 
— [KRD 
这 样 ，& 期 简单 毛 收 益 率 是 其 包含 的 这 和 & 个 单 期 简单 毛 收 益 率 的 乘积 ， 称 为 复合 收益 
率 (compound return). k 期 简单 净 收 益 率 为 R,|k|==(P, 一 P, ,)/P, ,. 
为 了 说 明 这 一 点 ， 表 1-1 给 出 了 苹果 公司 股票 的 每 日 收盘 价 . 由 于 2011 年 12 月 2 日 
和 9 日 是 星期 五 ， 所 以 每 周 的 股票 简单 毛 收 益 率 为 1 十 R,| 5] 二 393. 62/389. 701.0101, 
即 每 周 的 简单 收益 率 为 1. 01%. 
表 1-1 芋 果 公司 股票 从 2011 年 12 月 2 日 到 12 月 9 日 的 每 日 收盘 价 


日 期 702 12/05 12/06 12707 12/08 12/09 
BY RE C$ ) 389. 70 393.01 390.95 389. 09 390. 66 393. 62 








在 实际 中 ， 确 切 的 时 间 区 间 对 讨论 和 比较 收益 率 是 非常 重要 的 (例如 月 收益 率 还 是 年 
收益 率 )， 若 时 间 区 间 没 有 给 出 ， 这 里 隐 含 的 假定 时 间 区 间 为 一 年 ， 如 果 持 有 资产 的 期 限 
为 上 年 ， 则 (平均 ) 年 度 化 收益 率 定义 为 

年 度 化 的 {RCR]) =| Tater] 一 1 
这 是 由 它 所 包含 的 个 单 期 简单 毛 收 益 率 几何 平均 得 到 的 ， 可 用 下 式 计算 : 
年 度 化 的 {Rk]} = exp +D hA 十 R,,) | 一 1 
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其 中 exp(zx) 表 示 指 数 函 数 ，ln(zx) 是 正 数 xz 的 自然 对 数 . 因为 算术 平均 值 比 几何 平均 值 计 
算 起 来 容易 ， 并 且 单 期 收益 率 一 般 很 小 ， 所 以 我 们 可 用 一 阶 泰勒 (Taylor) 展 开 来 近似 表示 
年 度 化 的 收益 率 ， 则 有 








年 度 化 的 {R,[&]} ~ D (1-3) 
然而 ， 在 有 些 应 用 中 ， 式 (1-3) 的 近似 精确 度 可 能 不 够 

JE t SE P e i 

在 引进 连续 复 利 收益 率 之 前 ， 先 讨论 复 利 收益 率 的 效果 . AEC ER ÍT AE a I AF A] 28 
10%， 最 初 的 存款 为 1 美元， 如 果 银 行 每 年 文 付 一 次 利息 ， 则 一 年 后 存款 的 净值 变 为 1 Xx 
(+0. D=1.1 美元 ， 如 果 该 银行 半年 付 息 一 次 ， 则 六 个 月 的 利息 率 为 10%/2 二 5%， 一 年 后 
MELA 1X C1 0.1/2)" 二 1.1025 ou. 通 。 表 1-2 收益 率 复 利 效果 的 演示 (期 限 为 1 年 ， 
































To WRR- ENEA mK, MERIT 年 利率 为 10%) 
利率 为 10%/m， 一 年 后 存款 的 净值 变 成 了 
1X(+0.1/m)" 美元， #1-2 给 出 了 年 利 一 年 1 0.1 $1. 100 00 
CEOE- 半年 2 0. 05 $1. 102 50 
率 为 10% 时 ,一 些 常 用 的 时 间 间 隔 下 存款 1 ai i ee ere 
美元 的 净值 结果 . 尤其 是 ， 净 值 exp 0. 1) 每 月 12 0. 0083 $1.10471 
1. 1052 美元 ， 这 个 值 是 连续 复 利 的 结果 每 周 52 0.1/52 $ 1.105 06 
(result of continuous compounding). 我 们 每 天 369 0. 1/365 > 1.105 16 
可 以 清楚 地 看 到 复 利 的 效果 . E ae e 
Mi. ERA RA MHE A 可 以 表示 为 
A = C exp(r X n) (1-4) 
其 中 了 是 年 利率 ，C 是 初始 资本 ，n 是 持 有 资产 的 年 数 . 由 式 (1-4)， 则 有 
Ci A exp(—r Xn) (1-5) 
这 里 ，C 是 从 现在 开始 n 年 后 价值 为 A 的 资产 的 现 值 . 假定 7 是 用 连续 复 利 表示 的 年 利率 . 
连续 复合 收益 率 
资产 的 简单 毛 收 益 率 的 上 自然 对 数 称 为 连续 复合 收益 率 或 对 数 收益 率 (log-return) : 
r, = In +R, = np = Pe Pe (1-6) 
EP., p=In(P,), Sia Pica R, 相 比 ， 连 续 复 合 收 益 率 r 有 很 多 优点 . 首先， 对 多 


期 收益 率 ， 我 们 有 
ri[k] = nA HRED = nl HR) A +R) (+ Rea) ] 
= Indl +R) +n Re) ++ +n + Ree) 
r, 十 Fj 十 … + Feri 
这 样 ， 连 续 复 合 多 期 收益 率 是 它 所 包含 的 连续 复合 单 期 收益 率 之 和 . 其次， 对 数 收益 率 具 
有 更 容易 处 理 的 统计 特性 . 
为 了 说 明 这 一 点 ， 我 们 再 次 考虑 表 1-1 中 苹 采 公司 股票 的 日 收盘 价格 .从 12 月 8 日 到 





AE 


4 Rl 





12 H 9 AWA Xt Rue H BH r, =log(393. 62) —log(390. 66) 0.75%, M12 H 2 Rž 12 
月 9 日 的 周 对 数 收益 率 为 L5 J = log (393. 62) — log (389. 70) 1.00%. 显而易见 ， 周 对 数 
收益 率 是 该 周 的 5 个 日 对 数 收益 率 之 和 . 

资产 组 合 收益 认 

各 一 个 资产 组 合 由 项 资产 组 成 ， 则 该 资产 组 合 的 简单 兆 收 益 率 是 它 所 包含 的 各 项 资 
产 的 简单 净 收 益 率 的 加 权 平 均 ， 其 中 每 个 资产 的 权重 是 该 资产 的 价值 占 资产 组 合 总 价值 的 
ADE. i p 是 一 个 资产 组 合 ， 它 在 第 i 项 资产 上 的 权重 为 w;， 那 么 pp 在 t 时 刻 的 简单 收 
益 率 为 R = >) wiR。， 其 中 R; 是 组 合 中 第 i 个 资产 的 简单 收益 率 . 

然而 ， 资 产 组 合 的 连续 复合 收益 率 没 有 上 述 方 便 的 性 质 ， 如 果 人 简单 收益 率 R; 的 绝对 值 
很 小 ， 我 们 有 r ~ Dwr ， 其 中 六: 是 该 组 合 在 上 时 刻 的 连续 复合 收益 率 ， 经 常用 这 种 
近似 来 研究 资产 组 合 的 收益 率 . 

红利 支付 

如 采 一 项 资产 周期 性 地 文 付 红利 ， 则 我 们 需要 修改 资产 收益 率 的 定义 ， 设 D, 是 一 项 
资产 在 第 z 一 1 天 和 第 t 天 之 间 支 付 的 红利 ，P, 是 该 资产 在 第 t 个 周期 未 的 价格 ， 这 样 ， 红 
利 并 没有 包含 在 P, P. 则 zt 时 刻 的 简单 净 收 益 率 和 连续 复合 收益 率 分 别 为 
I, n~ InP, F D,)—ln(P) 























超额 收益 率 

一 项 资产 在 tt 时刻 的 超额 收益 率 是 该 项 资产 的 收益 率 与 某 项 参照 资产 的 收益 率 之 差 . 
参照 资产 通 第 是 无 风险 的 ， 如 美国 短期 国债 收益 这. 简单 超额 收益 座 和 对 数 超额 收益 率 分 
别 定 义 为 





A= KS Kes Se aT, (1-7) 
其 中 ，Ro, 和 ro 分 别 是 该 参照 资产 的 人 简单 收益 率 和 对 数 收益 率 .， 在 金融 学 文献 中 ， 超 额 收益 
RUA TE TEAR RAGIN ALA. 在 这 个 投资 组 合 中 ， 对 某 资 产 持 有 多 头头 寸 而 对 其 
BARRA AAT. AMMAR MNS. 
Hid: 多 头 金融 头寸 是 指 持 有 某 资 产 . 空头 头寸 是 指 卖 出 不 属于 自己 的 资产 ， 这 需要 通 
过 从 已 购买 该 资产 的 投资 者 那里 借入 资产 来 实现 . 随后 的 某 天 ， 卖 空 者 有 义务 买 进 与 借入 时 
完全 相同 数量 的 份额 来 偿还 借 出 者 . 偿还 时 要 求 相 等 数量 的 份额 ， 而 不 是 相等 数量 的 美元 ， 
因此 卖 空 者 会 由 于 该 资产 价格 的 下 跌 而 获 利 . 如 果 在 空头 持 有 期 间 该 资产 支付 现金 红利 ， 这 
些 红利 将 支付 给 做 空 合约 的 买方 ， 卖 空 者 必须 从 自己 的 资源 里 支付 相应 的 现金 红利 来 补偿 借 
出 者 . 换 龟 话说， 空头 方 有 义务 支付 所 借 资 产 的 现金 红利 给 资产 的 借 出 方 . a 
RAM BH 
简单 收益 率 R, BIEBER AT BOM a Rr, 的 关系 是 
r,=In(1+R,), R,=e"—1 
如 果 收 益 率 R, Br, 用 百分数 表示 ， 则 有 
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R, 
r, = 100ln( 1 + “0 
把 收益 率 进行 时 间 累 加 ， 则 有 
RR RR 
rik] = r: +r + ee Tr 
如 有 果 连 续 复 合 年 利率 为 -， 则 资产 现 值 与 资产 的 未 来 价值 之 间 的 关系 为 
A=Cexp(rXn), C= A exp(—rxXn) 
例 1.1 若菜 项 资产 的 月 对 数 收 益 率 为 4.46%， 则 相应 的 月 简单 收益 率 是 100Lexp(4. 46/ 
100)—1]=4. 56%. 同样 ， 知 某 项 资产 在 一 个 季度 内 的 月 对 数 收 益 率 分 别 为 4.46%, —7. 34% 


). R= 100ce" =) 








和 10.77%， 则 该 资产 季度 的 对 数 收益 率 为 < 
(4. 46 一 7. 34410. 77) %=7. 89%. E x“ he 
图 1-1 显示 了 IBM 股票 的 日 简单 收益 率 S 
及 其 对 数 收 益 率 的 时 序 图 ， 从 2001 年 1 月 2 2002 2004 2006 2008 2010 
Year 
+E AX J y 
日 到 2010 年 12 H 31 H, FE 2515 个 观测 a) 简单 收益 率 


值 ， 从 图 1-1 可 知 ， 和 简单 收益 率 相 比 ， 对 


数 收益 率 更 简单 ， 事 实 上 ， 简 单 收益 率 和 对 S| 
数 收益 率 之 间 的 相关 系数 为 0.9997， 这 是 | 








-0.10 0.05 


可 以 理解 的 ， 因 为 当 袜 接近 零 时 ，log(1 十 2002 2004 2006 2008 2010 
r)xr. 在 样本 持续 期 内 ，IBM REW H f ear 
单 收 益 率 的 数额 很 小 Pe 

图 1-1 IBM 股票 从 2001 年 1 月 2 日 到 2010 年 
1.2 债券 收益 和 价格 12 月 31 日 的 日 收益 率 时 序 图 





根据 票面 利率 (coupon payment) EHP A. ME E fot ae AS m EE SY A. 10 
收益 率 是 持 有 债券 至 到 期 日 ， 投 资 者 将 收取 的 回报 . CE LE. AJL PSS AY A A (at 2 
这 些 债券 的 收益 率 是 指 当 期 收益 率 和 到 期 收益 率 (Yield To Maturity, YTM). 
当期 收益 率 是 指 每 年 文 付 给 投资 者 回报 的 百分数 .从 数学 上 ， 我 们 有 
Yu 利息 Bil 0 
Me 一 ie 100% 
例如 ， 一 个 投资 者 购买 俩 券 文 付 90 美元 ， 债 券 面 值 ( 也 称 为 面值 (par value)) A 100 
元 ， 债 券 的 票面 利率 为 每 年 59 ， 则 该 债券 当期 收益 率 为 
c, = (0.05 X 100)/90 X 100% = 5.56% 
XE., RIH TER Sea ae RKA BA TA EB He. 从 定义 可 知 ， 当 期 收益 率 不 包含 任何 投 
资 过 程 中 的 资本 收益 或 损失 ， 对 于 零 上 县 债券 ， 收 益 率 的 计算 方法 如 下 : 


NY 25 KR 一 面值 = 
当期 收益 率 = (_ Ee) 


贡 券 是 一 种 金融 工具 ， 在 到 期 日 ， 回 债券 的 持 有 者 文 付 票面 价值 (或 面值 )， 有 些 债 券 
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6 h 1# 





这 里 , k 指 用 年 度 表示 的 到 期 时 间 . 举例 来 说 ， 如 果 投 资 者 购买 零 息 债券 ， 支 付 90 美 
元 ， 其 面值 为 100 美元 ， 该 债券 在 2 年 内 到 期 ， 则 该 债券 的 收益 率 为 c, = (100/90)? — 
1 三 5 41%; 

到 期 收益 率 

当期 收益 率 没 有 考虑 货币 的 时 间 价 值 ， 因 为 它 没有 考虑 投资 者 未 来 收 到 的 债券 利息 的 
当前 价值 .因此 ， 一 个 较为 常用 的 债券 投资 收益 是 到 期 收益 率 (YTM).， 然而 ， 到 期 收益 率 
的 计算 更 复杂 . 简单 地 说 ， 到 期 收益 率 是 通过 将 债券 的 价格 与 将 来 所 有 的 现金 流入 的 现 值 
相等 而 计算 出 的 收益 率 ， 在 购买 日 和 到 期 日 之 间 ， 假 设 该 债券 的 投资 者 收 到 & 期 利息 支付 . 
y 为 债券 的 到 期 收益 率 ，P 为 债券 的 价格 ， 则 有 
Cc C, C + F 
Le To i 
这 里 ,下 为 债券 的 面值 ，C; 是 第 i 期 的 利息 支付 ， 假定 每 年 的 债券 票面 利率 为 w， 每 年 文 
付 次 数 为 mwm， 到 期 时 间 为 n 年 ， 则 债券 利息 每 期 的 现金 流入 为 Fa/m， 文 付 期 数 为 & 二 mn. 
债券 价格 和 到 期 收益 率 计算 如 下 











P= 

















F 1 1 il F 
p= =. ee. ! E y = 
aca Gea + | + 
aF E F 
2 | = 


FRAR T (oi se Oe A Bic fat SR AY HE ROR, ke P= 100 S250, SS TH A 8 
5%， 每 半年 支付 一 次 ， 到 期 时 间 为 3 年 . 


到 期 收益 率 (%) 半年 收益 率 (%) 债券 价格 (美元 ) 





97. 29 
94. 67 
92.14 
89. 68 
87.31 





从 表 中 可 以 看 到 ， 随 春 债券 到 期 收益 率 的 增加 ， 俩 券 价格 在 下 降 . 换 句 话说 ， 到 期 收 
益 率 和 便 券 价格 成 反比 . 在 实践 中 ， 通 过 观测 到 的 债券 价格 ， 可 以 计算 出 到 期 收益 率 . 一 
般 不 容易 得 到 精确 的 解 ， 但 我 们 可 以 获得 一 些 精 确 的 近似 解 . 例如 ， 在 前 面 的 表 中 ， 购 天 
债券 的 投资 者 文 付 的 价格 为 94 美元 ， 则 到 期 收益 率 在 7 儿 一 8 儿 之 间 . 通过 试验 -更 正 错误 
的 试验 ， 得 到 投资 者 每 年 到 期 收益 率 约 为 7.26%. 许多 金融 机 构 提 供 在 线程 序 来 计算 债券 
到 期 收益 率 及 其 价格 ， 例如，Fidelity 投资 公司 . 


到 期 收益 率 (%) 半年 收益 率 (%) 债券 价格 (美元 ) 








(oul 94.41 
Ted 94. 16 
les 93. 90 
le 25 94. 03 
7. 26 94. 00 
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美国 政府 债券 
美国 政府 发 行 各 种 债券 ， 为 其 债务 进行 融资 . 这 些 债 券 包括 短期 国债 、 中 期 国债 和 长 

HO] EB) fot. 下面 给 出 这 些 债券 的 简单 描述 . 

。 短期 国 俩 (Treasury Bills，T-Bills) 在 一 年 或 一 年 以 内 到 期 在 到 期 前 ， 它 们 不 文 
付 任 何 利 县 ， 按 照 面值 来 折价 出 售 ， 从 而 产生 正 的 到 期 收益 率 ， 常用 的 期 限 有 28 
天 (1 个 月 )、91 天 (3 个 月 )、182 天 (6 个 月 ) 和 364 天 (1 年 )， 最 低 的 购买 价格 是 

100 美元 .短期 国债 折 现 收益 率 (相当 于 用 年 表示 的 当期 收益 率 ) 计 算 如 下 : 

m ee = 360 
折 现 收益 率 (%) = EEx 
XE., FAP 分别 表示 债券 的 面值 和 购买 价格 . 美国 财政 部 每 星期 四 宣布 13 
周 和 26 周 国 俩 的 发 行 数量 ， 接 下 来 的 周一 举行 拍卖 ， 周 四 进行 结算 . 每 周一 宣布 
4 周 国 俩 发 行 数量 ， 周 二 拍卖 ， 周 四 结算 . 第 4 个 星期 四 宣布 52 周 国 俩 的 发 行 数 
量 ， 接 下 来 的 周二 拍卖 ， 周 四 结算 . 

。 中 期 国债 (Treasury Notes, T-Notes) Æ 1~10 年 内 到 期 . 6 个 月 支付 一 次 利息 ， 
面值 为 1000 美元 ， 这 些 票 据 在 二 级 市 场 上 以 面值 的 32 进 制 的 百分数 来 报价 ， 例 
如 ， 报 价 为 95 : 08， 这 说 明 该 债券 以 折价 进行 交易 ， 即 价格 为 (95 十 8/32) x 1000/ 
100=952.5 美元 ， 当 我 们 讨论 美国 政府 债券 市 场 的 时 候 ，10 年 期 国债 已 经 成 为 报 
价 频率 和 安全 性 最 高 的 俩 养 . 详 见 下 一 万 和 芝加哥 期 权 交 多 所 (Chicago Board 
Options Exchange, CBOE) AY 10 年 期 债 养 . 图 1-5 和 图 1-7 分 别 列 出 了 美国 10 年 
期 政府 债券 日 收益 率 及 其 收益 率 的 时 序 图 . 

。 长 期 国债 (Treasury Bonds，T-Bonds) 有 更 长 的 到 期 期 限 ， 从 20 一 30 年 不 等 . 6 
个 月 支付 一 次 利明 ， 政 府 一 般 发 行 30 年 期 的 国 俩 . 从 2001 Æ 10 H 31 日 开始 ，30 
年 期 债券 暂停 了 4 年 零 6 个 月 . 在 2006 年 2 月 政府 开始 重新 发 行 ， 每 季度 发 行 
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股票 期 权 是 一 种 金融 合约 . 股票 A 的 看 涨 期 权 是 这 样 一 种 合约 ， 即 合约 持 有 者 在 给 定 
的 期 间 内 以 约定 的 价格 购买 一 定数 量 股票 A 的 权利 ， 而 不 是 义务 . 同时， 股票 A 的 看 跌 期 
权 是 这 样 的 一 种 合约 ， 即 合约 的 持 有 者 在 给 定 的 期 间 内 以 约定 的 价格 卖 出 一 定数 量 股票 A 
的 权利 ， 而 不 是 义务 . 这 里 约定 的 价格 称 为 执行 价格 (Cstrike price)， 给 定 的 时 间 期 间 称 为 
到 期 日 (time to maturity)， 在 美国 ， 每 份 股票 期 权 通 稼 包含 有 100 股 股票 期权 在 期 权 市 
场 进行 交易 ， 如 芝加哥 期 权 交 易 所 (CCBOE)， 期 权 有 很 多 种 类 型 .常用 的 有 欧式 期 权 ， 即 
只 有 在 到 期 日 才 可 行使 其 权利 .美式 期 权 ， 可 以 在 到 期 日 及 到 期 日 之 前 的 任何 时 刻 行使 其 
权利 . 详细 的 介绍 参见 Hull(2011). 如 有 果 期 权 在 立即 执行 时 给 其 持 有 人 的 现金 流 为 正 ， 我 
们 称 这 种 期 权 为 价 内 期 权 (in-the-money). 如 果 期 权 在 执行 时 ， 给 持 有 人 的 现金 流 为 负 ， 
我 们 称 其 为 价 外 期 权 (out-of-the-money). 最 后 ， 如 有 果 期 权 在 执行 时 给 持 有 人 的 现金 流 为 
雪 ， 我 们 称 它 为 平价 期 权 (Catrthe-money). 
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下 ， 推 导出 其 解析 解 ， 本 章 中 ， 只 要 注意 到 Black-Scholes 模型 中 唯一 的 一 个 不 能 直接 观测 
到 的 因子 是 股票 的 波动 率 就 可 以 了 . 这 里 的 波动 率 指 股票 价格 的 条 件 标准 差 . 在 实践 中 ， 
我 们 可 以 用 观测 到 的 股票 价格 和 Black-Scholes 模型 来 反 向 推导 出 其 波动 率 ， 这 个 波动 率 称 
为 隐 含 波动 率 (implied volatility)， 类 似 于 债券 到 期 收益 率 的 实现 过 程 ， 隐 含 波 动 率 可 以 近 
似 得 到 . 

大 家 都 熟知 的 隐 含 波动 率 是 芝加哥 期 权 交 易 所 (CBOE) 的 波动 率 指 数 (Volatility Index, 
VIX). 该 指数 最 初 在 1993 年 推出 ， 目 的 是 通过 S&P 100 平价 指数 期 权 价格 来 度量 30 天 
隐 含 波动 率 的 市 场 期 望 值 .该 指数 在 2003 
年 由 芝加哥 期 权 交 易 所 修订 ， 修 订 后 的 指数 
反映 了 期 望 波动 率 新 的 度量 方法 ， 现在 是 
S&P 500 指数 CSPX) 和 估计 的 期 望 波动 率 的 
加 权 和 平均， 权重 是 一 个 很 大 范围 的 执行 价格 
下 的 S&P 500 指数 看 涨 期 权 及 看 跌 期 权 的 
价格 . 详细 信息 请 参阅 CBOE VIX 白皮书 . 
新 的 VIX 通常 被 视 为 市 场 娩 令 情绪 的 影响 
因素 ， 在 金融 市 场 上 发 挥 着 重要 的 作用 . $ 
实 上 ， 波 动 率 指数 的 期 货 和 期 权 也 在 芝加哥 
期 权 交 易 所 进行 交易 . 
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2004 2006 2008 2010 2012 


图 1-2 显示 了 从 2004 42 1 H 2 HAJ 2011 Year 
年 11 月 21 日 修订 后 的 VIX 指数 的 时 序 图 ， 图 1L? J 2004 42 1: A 2 BB) 201142 11 H 21H 
FE 1988 个 观测 值 . 从 图 1-2 中 可 知 ， 在 2008 芝加哥 期 权 交 易 所 波动 率 指数 的 时 序 图 


AFF JER A 2009 年 年 初 ， 金 融 市 场 的 波动 性 非 
fia. Æ 2011 年 市 场 的 波动 性 也 很 高 ， 在 后 面 的 章节 ， 我 们 将 分 析 波 动 率 指数 ， 关 于 资产 波 
动 率 更 详细 的 信息 ， 请 参阅 本 书 的 第 4 BE. 


1.4 R 软 件 包 及 其 演示 


在 研究 金融 数据 的 真实 例子 之 前 ， 我 们 先 价 要 地 介绍 本 书 中 广泛 应 用 的 及 软件 ， 当 数 
据 分 析 中 需要 用 到 相关 的 及 添加 包 及 其 命令 时 ， 将 给 出 相应 的 介绍 . 我们 的 目的 是 使 实证 
分 析 尽 可 能 容易 ， 这 样 读 者 可 以 自己 运行 程序 来 得 到 本 书 给 出 的 结果 . 

R 是 一 蒜 人 免费 软件 ， 可 以 从 http://www. r-project. org FÆ. R 可 以 在 很 多 操作 系统 
上 运行 ， 包括 Linux, MacOS X 和 Windows. Æ R 软件 的 网 站 上 我 们 可 以 点 击 “CRAN”， 
选择 附近 的 CRAN 镜像 ， 下 载 并 安 逆 该 软件 并 选择 其 添加 包 .， 最 简单 的 安装 方法 是 按照 在 
线 指 导 ， 使 用 默认 选项 来 完成 ， 由 于 及 是 一 个 开放 源 代 码 软件 ， 所 以 它 包 含 了 研究 者 开发 的 
数 百 个 添加 包 ， 以 供 世 界 各 地 的 研究 人 员 进 行 各 种 统计 分 析 和 应 用 .对 于 金融 时 间 序 列 分 析 ， 
Diethelm Wuertz 博士 和 他 的 同事 开发 了 很 多 有 用 的 软件 包 ， 包 括 fBasics, fGarch 和 fPortfolio. 
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本 书 中 我 们 使 用 这 些 添加 包 的 很 多 功能 .我 们 还 可 以 使 用 R 其 他 的 添加 包 ， 这 些 添加 包 功 能 
更 强大 和 易于 使 用 ， 如 R 中 用 于 极 值 分 析 的 evir 添加 包 . 关于 R 安装 及 命令 的 更 多 信息 ， 可 
在 本 书 的 网 页 或 作者 的 教学 网 页 上 找到 .现在 有 多 本 关于 R 的 入 门 书籍 ， 例如， 可 以 参见 
Adler(2010) 和 Crawley(2007). R 命令 区 分 大 小 写 ， 必 须 完 全 遵守 ， 


1.4.1 REABW RR 


EARUM ee R 软件 后 ， 将 在 计算 机 果 面 上 创建 一 个 R Ap. 只 需 双 击 该 R AI 
标 ， 即 可 局 动 R 程序 .对 于 Windows 系统 ， 将 会 给 出 一 个 珊 有 命令 末 单 和 R 控制 台 的 
RGui 窗口 . BOR RUIN. WU Ae ee a”, PR "安装 程序 包 " 来 选择 需要 安 
装 的 添加 包 . 这 时 会 弹出 一 个 窗口 ， 询 问 用 户 选 择 R 镜像 (和 前 面 提 到 过 的 及 安 朔 相 类 
W. 选择 好 镜像 后 ， 会 弹出 另 一 个 窗口 ， 里 面包 含 所 有 可 用 的 添加 包 ， 可 以 单 击 所 需 的 
YAS JIM EL EAT KR. 

CRIER. FY PA a Be Fe RE ee a SET WR TS 
加 包 加 载 到 R 中 . 单 击 该 子 命令 后 ， 会 弹出 一 个 窗口 ， 它 列 出 所 有 已 经 安 疙 的 添加 包 ， 供 用 
PUREE. AMIN BASIN A ee library 命令 ， 详 见 下 面 讨论 中 的 演示 . 


1.4.2 Quantmod 软件 包 


首 爷 ， 我 们 看 看 笛 用 的 及 添加 包 ， 可 以 从 一 些 开 放 源 直接 下 载 金融 数据 ， 这 些 网 站 包 
括 雅 虎 财经 、 谷 歌 财经 和 圣路易斯 联邦 储备 银行 的 联邦 储备 经 济 数 据 库 CFRED)， 强烈 建 
WER Jeffry 开发 的 quantmod WIN. Wasi ibis RRR TTR, xts 和 zoo 三 个 额外 的 
as JN Ed. 

ERICE. quantmod 添加 包 人 允许 用 户 与 互联 网 连接 ， 用 户 可 以 使 用 一 些 命令 符 来 
访问 雅虎 和 谷歌 财经 的 日 股票 数据 ， 使 用 这 些 序列 名 称 来 访问 来 目 联 邦 储备 经 济 数 据 库 超 
































N WW GAD Fy A Bit t N x 
过 1000 个 经 济 和 金融 时 间 序 列 数据 . AAPL (2007-01-03/2011-12-02) 
命令 是 getSymbols. 该 添加 包 有 很 Last389.7 本 


好 的 功能 ， 人 例如， 命令 chartSeries 
可 以 直接 画 出 这 些 序列 的 收盘 价 和 交易 
量 的 时 序 图 . 这 两 个 命令 的 默认 选项 对 
于 分 析 金 融 时 间 序列 来 说 是 足够 的 ， 每 
个 人 都 可 以 使 用 其 子 命 令 进一步 扩展 该 
添加 包 的 功能 ， 如 在 命令 getSym- | a 
bols 中 设 定 收益 率 的 时 间 跨 度 ， 有 兴 0] sro S 
趣 的 谈 者 可 以 查阅 这 些 命 令 的 相关 摘 40 IMN” 
述 这 里 ， 我 们 提供 一 个 简单 示例 . peyote wt 
图 1.3 显示 了 苞 困 公司 股票 从 2007 年 1 。 Jn032007 Jul012008 Jan042010 Jul 01 2011 

月 3 日 至 2011 年 12 月 2 日 的 日 收盘 价 图 1-3 从 2007 年 1 月 3 日 至 2011 年 12 月 2 日 苹果 公 
及 成 交 量 的 时 序 图 . 该 图 显示 了 最 近 可 司 股票 的 日 收盘 价 及 成 交 量 的 时 序 图 
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观测 数据 的 价格 和 交易 量 . chartseries 中 的 子 命令 theme 二 "white" 可 用 来 设置 时 序 
图 的 背景 ， 默 认为 黑色 . 图 1-4 显示 了 从 1948 年 1 月 至 2011 年 11 月 美国 月 失业 率 的 时 序 
Kl. Kl 1-5 显示 了 从 2007 年 1 月 3 日 至 2011 年 12 月 2 日 10 年 期 美国 国债 日 利率 的 时 序 
A). 这些 利率 来 自 芝 加 哥 期 权 交 易 所 (CBOE)， 数 据 来 自 雅虎 财经 网 站 . 由 于 没有 成 交 量 ， 
所 以 在 chartseries 中 ， 子 命令 TA= NULL 常常 用 来 表示 时 序 图 中 忽略 交易 量 . 命令 
head 和 tail 分 别 给 出 数据 集 的 前 6 行 数据 和 最 后 6 行 数 据 . 


UNRATE (1948-01-01/2011-11-01) TNX (2007-01-03/2011-12-02) 




















Jan 1948 Jan 1965 Jan 1980 Jan1995 Jan 2010 Jan 032007 Jul012008 Jan042010 Jul 012011 
Al 1-4 JM 1948 € 1 H2 2011 € 11 月 美国 K 1-27 2007 ¥ 1 H 3 AB 2011421226 
月 失业 率 的 时 序 图 美国 10 年 期 国债 日 利率 的 时 序 图 


带 有 quantmod 添加 包 的 R 演示 (本 书 中 的 R 输出 经 过 了 排版 编辑 ,， “二 ”表示 命令 提示 
符 、% 表 示 其 后 为 注释 内 容 ) 

> library (quantmod) % Load the package 

> getSymbols("AAPL")} % Download daily prices of Apple stock from Yahoo 

[1] "AAPL" % I ran R on 2011-12-03 so that the last day was 12-02. 

> dim(AAPL) % (dimension): See the size of the downloaded data. 

[1]: 1241 6 

> head(AAPL) ¢% See the first 6 rows of the data 





Open High Low Close Volume Adjusted 

2007-01-03 86.29 86.58 81.90 83.80 44225700 83.80 

2007-01-04 84.05 85.95 83.82 85.66 30259300 85.66 

2007-01-10 94.75 97.80 93.45 97.00 105460000 97.00 
> tail (AAPL) % See the last 6 rows of the data 

Open High Low Close Volume Adjusted 

2011-11-25 368.42 371.15 363.32 363.57 9098600 363.57 

2011-12-01 382.54 389.00 380.75 387.93 13709400 387.93 

2011-12-02 389.83 393.63 388.58 389.70 13537700 389.70 


> chartSeries (AAPL,theme="white") % Plot the daily price and volume 
% The subcommand theme is used to obtain white background of the plot. 
> chartSeries(AAPL)%Not shown giving the same plot with black background. 
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% The next command specifies the data span of interest 
> getSymbols("AAPL", from="2005-01-02", to="2010-12-31") 
{1} "AAPL" 
> head (AAPL) 

AAPL.Open AAPL.High AAPL.Low AAPL.Close AAPL.Volume Adjusted 
2005-01-03 64.78 65.11 62.60 63.29 24714000 cs a OR 
2005-01-04 63.79 65.47 62.97 63.94 39171800 31.97 
> getSymbols("“UNRATE",src="FRED") Download unemployment rates from FRED. 
[1] "UNRATE" 
> head (UNRATE) 

UNRATE 
1948-01-01 3.4 
1948-02-01 3.8 
1948-06-01 3.6 
> chartSeries(UNRATE,theme="white") % Plot monthly unemployment rates 
% The subcommand "src" is used to specify the data source. 
% The default is Yahoo. 
> getSymbols("INTC",src="google") % Download data from Google. 


(2) "Ir" 
> head(INTC) 

INTC.Open INTC.High INTC.Low INTC.Close INTC.Volume 
2007-01-03 20.45 20.88 20.14 20.35 68665100 
2007-01-04 20.63 21.33 20.56 at Ree A 87795400 
2007-01-10 21.09 21.62 21.03 > 和 75522200 


> getSymbols("* TNX") % Download CBOE 10-year Treasures Notes 


C1). “THK: 
> head (TNX) 

TNX.Open TNX.High TNX.Low TNX.Close Volume Adjusted 
2007-01-03 4.66 4.69 4.64 4.66 0 4.66 
2007-01-04 4.66 4.66 4.60 4.62 0 4.62 
2007-01-10 4.67 4.70 4.66 4.68 0 4.68 


> chartSeries (TNX, theme="white",TA=NULL) * Obtain plot without volume. 


1.4.3 R 的 基本 命令 


局 动 信 以后， 要 做 的 第 一 件 事 是 设置 工作 目录 所 谓 工 作 目 录 ， 是 指 我 们 存放 数据 集 
和 输出 结果 的 计算 机 目录 . 可 以 用 两 种 途径 实现 . 第 一 种 方法 是 单 击 “ 文 件 ” 亲 单 的 “改变 
工作 目录 ……” 子 命令 ， 弹 出 一 个 窗口 ， 此 时 可 以 选择 所 需要 的 目录 . 第 二 种 方法 是 通过 R 
控制 台 ， 使 用 命令 setwd 来 设置 工作 目录 . 具体 可 以 参考 下 面 的 演示 . 

R 是 一 球面 丫 对 象 的 软件 ， 可 以 处 理 多 种 类 型 的 对 象 . 本 书 中 我 们 不 需要 研究 R 中 对 象 
的 话 细 信息 ， 用 到 时 将 给 出 解释 .可 以 资 ，R 允许 给 变量 赋值 ， 通 过 变量 名 称 来 引用 这 些 值 . 
赋值 运算 符 是 “二 一 ”， 也 可 以 使 用 “二 ” 比如 , “x 二 一 10” 表 示 把 10 这 个 数值 赋 给 变量 “x”， 
这 里 R 把 "六 作为 一 个 实数 序列 ， 其 第 一 个 元 系 为 10， 有 几 种 方法 可 以 将 数据 加 载 到 及 的 工 
作 空 间 ， 具 体 方式 取决 于 数据 的 格式 ， 对 于 简单 的 纯 文 本 数据 ， 其 命令 是 read. table. 对 
于 .csv 文 件 ， 命 令 是 fead. csv. 可 以 用 单 引 号 或 者 双 引 号 来 指定 数据 文件 ， 详 见 R 代码 演 
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示 . 及 将 数据 作为 对 象 ， 通 过 为 它们 指定 的 名 称 来 引用 这 些 数 据 ， 对 于 上 述 两 个 数据 加 载 命 
令 ，R 将 数据 存储 在 矩阵 框 中 .还 可 以 使 用 命令 aim( 即 ， 维 度 ) 来 查看 数据 集 的 大 小 .最 后 ， 
R 中 的 基本 操作 和 我 们 通常 使 用 的 软件 类 似 ， 可 以 使 用 命令 qO 〇 选择 退出 . 

R 代码 演示 

> setwd("C:/Users/rst/book/introTS/data") % Set my working directory 

> library(fBasics) % Load package 

> x <- 10 % Assign value, here "x" is a variable. 

> x $ See the value of x. 


[1] 10 * Here [1] signifies the first element. 
> 1 + 2 % Basic operation: addition 


[1] 3 
> 10/2 % Basic operation: division 
[1] 5 


% Use * and ~ for multiplication and power, respectively. 
$ Use log for the natural logarithm. 
> da=read.table('d-ibm-0110.txt’',header=T) % Load text data with names. 
> head(da) % See the first 6 rows 

date return 
20010102 -0.002206 
20010103 0.115696 


Bo H} 


6 20010109 -0.010688 
> dim(da) % Dimension of the data object "da". 
[1] 2515 2 
> da <- read.csv("d-vix041l.csv",header=T) % Load csv data with names. 
> head(da) % See the first 6 rows 
Date VIX.Open VIX.High VIX.Low VIxX.Close 


1 1/2/2004 17.96 18.68 17.54 18.22 
2 1/5/2004 18.45 18.49 17.44 17.49 
6 1/9/2004 16.15 16.88 15.57 16.75 


1.5 金融 数据 的 例子 


在 本 中， 我 们 研究 金融 时 间 序 列 收 益 率 的 变化 ， 图 1-6 给 出 了 从 2007 年 1 月 4 日 至 
2011 年 12 月 2 日 苹果 公司 股票 的 日 对 数 收 益 率 的 时 序 图 ， 根 据 前 面 的 定义 ,日 对 数 收益 
率 人 简化 为 股票 价格 对 数 的 变化 ， 在 R 中 ,序列 的 变化 可 以 很 容易 通过 对 数 价格 的 差 (differ- 
ence) 得 到 . 具体 来 说 ,7 二 ln(p,) 一 ln(p,-1)， 这 里 p, Nt 时 刻 的 股票 价格 .在 演示 中 ， 
我 们 使 用 调整 后 的 价格 来 计算 股票 的 对 数 收益 率 ， 因 为 在 样本 期 间 ， 调 整 后 的 股票 价格 考 
E TRETH. ME 1-6 中 可 以 看 到 : 1) 存 在 一 些 大 的 异常 值 ; 2) 这 些 收益 率 序 列 在 茶 
些 时 期 波动 很 大 ， 而 在 其 他 时 候 是 稳定 的 . 前 者 称 为 资产 收益 率 存 在 看 厚 尾 现象 ， 后 者 称 
为 收益 率 波 动 集聚 (volatility clustering) ME. 

图 1-7 显示 了 从 2007 年 1 月 4 日 至 2011 年 12 月 2 日 10 年 期 国债 到 期 收益 率 日 变化 的 
时 序 图 ，10 年 期 国债 的 到 期 收益 率 显 示 出 和 苹果 公司 股票 日 收益 率 相 类 似 的 特征 . 图 1-8 
提供 了 欧元 /美元 汇率 日 对 数 收益 率 的 时 序 图 . 同样， 汇率 的 日 对 数 收 益 率 和 股票 的 日 对 
数 收益 率 表 现 出 了 相同 的 特性 .图 1-9 中 给 出 了 欧元 /美元 的 日 汇率 ， 数 据 来 目 FRED. 
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图 1-8 欧元 /美元 汇率 日 对 数 收益 率 的 时 序 图 


R 代码 演示 


> library (quantmod) 





Jan 04 2007 Jul 01 2008 Jan 042010 Jul 01 2011 


Al 1-7 从 2007 年 1 月 4 日 至 2011 年 12 月 2 日 
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图 1-9 





> getSymbols("AAPL", from="2007-01-03",to="2011-12-02") %Specify period 


[ 1 ] "AAPL" 


> AAPL.rtn=diff (log (AAPLSAAPL.Adjusted)) % Compute log returns 


> chartSeries (AAPL. rtn, theme="white") 


> getSymbols("~ TNX", from="2007-01-03", to="2011-12-02") 


[1] "THY" 


> TNX.rtn=diff (TNX$TNX. Adjusted) % Compute changes 


> chartSeries (TNX.rtn, theme="white"} 


> getSymbols("DEXUSEU",src="FRED") % Obtain exchange rates from FRED 


[1] "DEXUSEU" 
> head (DEXUSEU) 
DEXUSEU 


1999-01-04 1.1812 





= Ble 





1999-01-05 1.1760 


1999-01-11 1.1534 

> tail (DEXUSEU) 
DEXUSEU 

2011-12-09 1.3368 


2011-12-16 1.3025 

> USEU.rtn=diff (log (DEXUSEUSDEXUSEU) } 
> chartSeries (DEXUSEU, theme="white" ) 
> chartSeries (USEU.rtn, theme="white"] 


1.6 收益 率 的 分 布 性 质 


为 了 更 好 地 理解 资产 收益 率 ， 我 们 先 来 研究 这 些 资产 收益 率 分 布 的 性 质 ， 为 了 研究 不 
同 资产 、 不 同时 期 收益 率 的 行为 表现 ， 考 虑 一 个 N 个 资产 的 集合 ,在 工 个 时 间 周 期 内 持 有 
这 NN 个 资产 ， 即 1 二 1，…， 人 对 每 个 资产 i， 表示 在 t 时 刻 的 对 数 收益 率 ， 要 研究 的 对 
BUN fe BA {ras 1 二 1，…，N; c=1, ee T). 也 可 以 考虑 简单 收益 率 {Ri; 1 二 1 ，…， 
Ni t 王 1，…， 人 和 对 数 超额 收益 认 (Z285 二] NI t51, e, T). 
统计 分 布 及 其 矩 的 回顾 

我 们 简要 地 回顾 一 下 统计 分 布 的 基本 性 质 和 随机 变量 的 和 矩 . R* 表示 维 欧 几 里 得 空 
a], LER 表示 x 是 R* 中 的 一 个 点 .考虑 两 个 随机 向 量 X= OX, oe, XO YH, e, 
Y,)'. & PCXEA, YEB EA X EFA ACR 目下 在 子 空 间 BCR* 中 的 概率 ， 大 多 数 
时 候 ， 这 里 都 假定 随机 癌 量 是 连续 的 . 

联合 分 布 

PRA Fyy (x, y; 0) 一 P(X 三 x,， Yoy; 0) 表 示 变 量 半 与 Y 的 参数 为 0 的 联合 分 布 函 
数 ， 其 中 xER*，yE€ R"， 不 等 号 “之 ”是 分 量 对 分 量 的 运算 . X 和 YY 的 规律 可 由 联合 分 布 函 
数 Fx.y(x，y; 0) 来 刻画 例如，X 和 Y 之 间 的 线性 相依 性 可 以 由 联合 分 布 的 协 方差 来 给 
H. WR X MY 的 联合 概率 密度 函数 fy xs ys OFE, 

Fxy(x,y;0) = | | fos (ws2s6)dedee 
XE, XAY 是 连续 随机 癌 量 . 
边际 分 布 
X 的 边际 分 布 为 








N 


Fx(x;0) = Fxyy(x,œ,*,œ;0) 
这 样 ，X 的 边际 分 布 可 通过 对 Y 求 积 分 得 到 . Y 的 边际 分 布 也 可 以 类 似 得 到 . 
如 果 R=1, X 是 一 个 标量 随机 变量 ， 其 分 布 函数 变 成 
FxCz) 一 PIGX 二 Zi0) 
称 为 XX 的 累积 分 布 汝 数 (Cumulative Distribution Function, CDF). fa] PK A 4) m KA. 一 
个 随机 变量 的 分 布 函 数 是 非 递减 的 ， 即 对 于 羡 科 心 MA Felan) SFC), HW E 
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Fx( 一 co) 王 0，Fx(Cco) 王 1， 对 于 给 定 的 概率 p, 使 PSP y (zy) 成 立 的 最 小 实数 xy 称 为 随 
机 变量 X 的 第 p 分 位 数 (quantile)， 更 具体 地 ， 有 
= inf{x | p < Fx(x)} 
本 书 中 我 们 用 CDF 来 计算 检验 统计 量 的 (EL. 
条 件 分 布 
给 定 Y 委 y 的 条 件 下 ，X 的 条 件 分 布 为 


Rot = ee 


P(Y < y;@) 
FR RE PRE TE. MERE Y=y 的 条 件 下 ，X 的 条 件 密度 为 
: = Fay (X,Yy;0) 7 
Fly (430) #38) (1-8) 





EF, by OE pea f,(y; OAT FA FAE] 
fy ys =" f(x: 930) dx 
由 式 (1-8) 可 知 ， 联 合 分 布 、 边 际 分 布 和 条 件 分 布 之 间 的 关系 可 以 表示 为 
fay (xX,y;0) = fry(xs@ X f,(y;0) (1-9) 
PS ABUSE A TE EY TAY pl] a FAA 2) CA ER ADA TAIT. gla. X 与 了 是 相互 独立 
的 随机 向 量 ， 当 且 仅 当 fi ,Cx; O=f. Ce; O. RIN, fe ys OHS. (es OEG 0). [21] 
随机 变量 的 算 
一 个 连续 型 随机 变量 X 的 2 阶 矩 定义 为 
a, =e oe ii TRR 


Hp E RIHIA (expectation), f(x) x X MLAS AE ew Be. 一 阶 矩 称 为 X 的 均值 (mean) 
或 期 望 (expectation) ， 它 用 来 度量 该 分 布 的 中 心 位 置 ， 记 为 ue 对 于 资产 ， 感 兴趣 的 是 它 
的 均值 是 否 为 零 ， 换 句 话 说， 我 们 通 第 认为 原 假 设 为 Ho: :二 0， 其 备 择 假 设 为 H, : yA 
0， 或 者 At jy. 三 0， 其 备 择 假设 为 H, 心 二 0. 
第 Z 阶 中 心 矩 定义 为 
me = EUX— pY] =| (p Fwd 


这 里 假定 上 式 中 积分 存在 . PU RET DAE eX i SS EL RE. PR X 的 方差 (va- 
riance)， 记 为 oi. 方差 的 正平 方 根 o,， 称 为 X 的 标准 差 (standard deviation). 对 于 资产 收 
益 率 ,方差 (或 标准 差 ) 是 测量 不 确定 性 的 指标 ， 因 此 经 常用 于 资产 的 风险 管理 和 上 度量. 随 
机 变量 的 正 态 分 布 可 由 它 的 前 两 阶 矩 来 确定 . 而 对 于 其 他 分 布 ， 可 能 需要 更 高 阶 的 矩 . 

X 的 三 阶 中 心 矩 度量 关于 其 均值 的 对 称 性 ， 而 四 阶 中 心 矩 度量 X 的 尾部 特征 .在 统计 
学 中 ， 标 准 化 的 三 阶 中 心 矩 称 为 偏 度 (skewness)， 标 准 化 的 四 阶 中 心 矩 称 为 峰 度 (kurto- 
sis)， 它 们 分 别 用 来 描述 随机 变量 的 非 对 称 程度 和 其 尾部 厚度 . 具体 地 说 ，X 的 偏 度 和 峰 
度 分 别 定 义 为 
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—_ 3 o 4 
S(x) = e| Zy bs) i? K(x) = E| AT ee Ba) l 
Oa 


数量 K Car) — en kurtosis), KAES IRE K(x) 二 3， 这样 ， 
正 态 随机 变量 的 超额 峰 度 为 0。 硅 一 个 分 布 具 有 正 的 超额 峰 度 ， 称 为 具有 厚 尾 性 . 也 就 是 
w. FEMI O die cuba wana TE”. EXP, ORR GOR HX 
样 分 布 的 随机 样本 包含 更 多 的 极 值 ， CRE (9 A) AB BEI ROE M Cleptokurtic). Pi: = 
个 具有 人 负 超 额 峰 度 的 分 布 是 薄 尾 的 (例如 ， 有 限 区 间 上 的 均匀 分 布 )， 这 样 的 分 布 称 为 低 峰 
HJ (platykurtic). 在 金融 市 场 上 ,可 以 用 随机 变量 的 第 一 到 第 四 阶 矩 来 描述 资产 收益 率 的 
表现 .这 并 不 意味 着 高 阶 矩 不 重要 ， 只 是 它们 学 习 起 来 更 加 困难 . 

在 应 用 中 ， 随 机 变量 的 和 矩 可 以 用 相应 的 样本 偏 度 和 样本 峰 度 来 估计 ， 设 {zxi，…，Zr) 
是 X 的 工 个 观测 值 ， 其 样本 均值 表示 为 



































ja = 7 (1-10) 
样本 方差 表示 为 
A Los E, 
fi = Dy ETA) (1-11) 
样本 偏 度 表示 为 
= l : E.. f 
S(x) = ope ye A (1-12) 
样本 峰 度 表 示 为 
R d j e t.. f 
K (x) Bla FG Be) (1-13) 


在 相当 弱 的 条 件 下 ， 样 本 均值 所 是 jy; B ZN Tooth, A 收敛 到 yy,. 
更 具体 地 说 ， 当 工 充分 大 时 ， A inier oz/T)， 该 结 末 经 常用 于 有 关 u 的 假设 
检验 ， 例如， 考虑 原 假设 At jy; 二 0， 其 备 择 假设 为 A, p0. 检验 统计 量 为 
= Gi 


服从 一 个 目 由 度 为 工 一 1 的 学 生 上 分 布 . MEN ACH 三 ， 其 检验 统计 量 接近 一 个 标准 
正 态 分 布 ， 在 显著 性 水 平 为 100a% 时 ， 如 果 满 足 |z| 二 Z1-。;， 那 么 该 条 规则 可 以 用 来 拒绝 
inl oo FL Zi 是 标准 正 态 分 布 的 第 (1 一 x/2) 分 位 数 . 大 多 数 统计 软件 包 可 以 提供 
每 个 检验 统计 量 的 伴随 概率 的 p 值 ， 在 显著 性 水 平 为 100a% 时 ， 如 果 检 验 统 计量 的 p 值 小 
于 显 车 性 水 平 x， 那 么 决策 规则 为 拒绝 原 假设 H 
如 果 光 是 一 个 正春 随机 变量 ， 则 (x) 和 让 (2) 一 3 的 分 布 渐 近 为 均 什 为 惟 ， 方差 分 别 是 
6/T H 24/ 古 的 正 态 分 布 ， 有 具体 参见 Snedecor 和 Cochran(1980, 第 78 页 )， 我 们 可 以 用 这 些 渐 
近 分 布 的 性 质 来 检验 资产 收益 率 是 否 具 有 正 态 性 . 给 定 一 个 资产 收益 率 序列 (ri ，…，rr)， 
Be iy Sor ig EE. Se RE H : Sr) =0 和 备 择 假设 At SO)AO. 由 式 (1-12) 定 义 的 样 
本 偏 度 的 上 比 为 

















— 
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— Sr) 
VT 
决策 规则 如 下 : 在 显 车 性 水 平 为 a 时 ， 奉 满足 |t| 二 Z1 。s:;， 则 拒绝 原 假 设 . 
类 似 地 ， 我 们 可 以 检验 收益 率 序 列 的 超额 峰 度 ,假设 右 。: K(r) 一 3 二 0， 其 备 择 假设 
HOH, : K(7) 一 3 了 关 0. 则 检验 统计 量 为 
pan Kr) — 3 
V24/T 
该 统计 量 服 从 一 个 渐 近 的 标准 正 态 分 布 ， 当 且 仪 当 检 验 统计 量 的 2 值 小 于 显著 性 水 平 时 ， 
决策 规则 拒绝 原 假设 Ho. Jarque 和 Bera(1987) 将 两 个 先 验 检验 结合 在 一 起 检验 7, 的 正 态 
性 ， 则 检验 统计 量 为 











Sr) (K(r) — 3)? 
= a vo 24/T 
该 统计 量 渐 近 为 一 个 自由 度 为 2 的 Xx 随机 变量 ， 当 JB 统 计量 的 p 值 小 于 显著 性 水 平 a 时， 
则 拒绝 正 态 性 分 布 的 原 假设 . 

例 1.2 考虑 3M 公司 股票 从 2001 年 1 月 2 日 至 2011 年 9 月 30 日 的 日 简单 收益 率 的 
数据 ， 该 数据 来 自 芝 加 哥 大 学 证 券 价 格 研 究 中 心 CCRSP)， 图 1-10 给 出 了 数据 的 时 序 图 . 
这 里 我 们 使 用 Rmetrics 中 的 及 添加 包 fBasics 的 basicstats 命令 ， 计 算 收益 率 的 汇总 统 
计数 据 ， 并 进行 一 些 基 本 假设 检验 . 从 上 述 绪 末 可 知 ， 共 有 2704 个 数据 点 ， 简 单 收 益 率 的 
样本 均值 为 0.0278%， 样 本 标准 差 为 0.0155. 样本 偏 度 和 超额 峰 度 分 别 为 0.0279 和 
4.631. 下 面 考 虑 原 假设 H, : jy 二 0， 其 备 择 假设 为 H, : yy 了 关 0， 其 中 jy 表示 3M 公司 股票 
简单 收益 率 的 平均 值 ， 其 检验 统计 量 为 


JB 
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MJ 1-10 从 2001 年 1 月 2 日 至 2011 年 9 月 30 日 3M 公司 股票 日 简单 收益 率 数 据 的 时 序 图 





一 Ble 





pa 0.000278 _ 

0.01557 4/2704 
这 里 pN 0.35, KF 0.05. 因此 ,在 5% 的 显著 性 水 平 下 ， 我 们 不 能 拒绝 原 假设 .对 于 
偏 度 ， 原 假设 为 H, : S 一 0， 其 备 择 假 设 为 H.: S$ 和 关 0， 其 检验 统计 量 为 

pee 0021 le ce 

6/2704 

p IEN 0.55. MA. Æ 5% 的 显著 性 水 平 下 ， 我 们 不 能 拒绝 原 假设 .对 于 超额 峰 度 ， 原 假 
设 为 H, : K 一 3 二 0， 其 备 择 假 设 为 H,: K 一 3 了 关 0. 对 于 3M 公司 的 股票 收益 率 ， 其 检验 
统计 量 为 





Jaa 





pS Oa, 
24/2704 
比 标准 正 态 分 布 大 ， 其 p 值 接 近 于 零 ， 因 此 ， 可 以 拒绝 KK=3 的 原 假设 .换言之 ，3M 公司 
股票 的 日 简单 收益 有 一 个 较 大 的 尾部 ， 最后，Jarque-Bera 检验 统计 量 是 2422， 比 自由 度 为 
2 的 Xx 分 布 大 ,因此 ，3M 公司 日 简单 收益 的 正 态 性 假设 被 拒绝 .该 收益 率 有 较 大 的 厚 尾 
现象 并 不 奇怪 . a 
R 代码 演示 (输出 经 过 编辑 ) 


> library(fBasics) % Load package 
> da=read.table("d-mmm-0111.txt",header=T) % Load data 





> head(da) % Show the first 6 rows of data 
date rtn 
1 20010102 -0.010892 


6 20010109 -0.015727 
> mmm=da[(,2] $% Obtain 3m simple returns 
> basicStats(mmm) %$Compute summary statistics 


mmm 

nobs 2704.000000 & Sample size 

NAs 0.000000 % No of missing values 

Minimum -0.089569 % Minimum 

Maximum 0.098784 % Maximum 

1. Quartile -0.007161 % 25th percentile 

3. Quartile 0.007987 % 75th percentile 

Mean 0.000278 % Sample mean 

Median 0.000350 % Sample median 

Sum 0.751082 % Sample total 

SE Mean 0.000298 % Standard error of Sample mean 
% = sqrt (sample variance/sample size} 

LCL Mean -0.000306 % Lower bound of 95% C.I. 

UCL Mean 0.000862 % Upper bound of 95% C.I. 

Variance 0.000240 % Sample variance 

Stdev 0.015488 % Sample standard error 

Skewness 0.027949 % Sample skewness 

Kurtosis 4.630925 & % Sample excess kurtosis 


% Commands for individual moments 
> mean (mmm) 
[1] 0.000277767 
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> var (mmm) 

[1] 0.0002398835 
> stdev(mmm) $ standard deviation 

[1] 0.01548817 
% Simple tests 
> t.test(mmm) % Testing mean return = 0 

One Sample t-test 

data: mmm 
t = 0.9326, dË = 2703, p-value = 0.3511 
alternative hypothesis: true mean is not equal to 0 
95 percent confidence interval: 

-0.0003062688 0.0008618028 % See prior summary statistics. 
% p-value > 0.05; one cannot reject the null hypothesis. 


> s3=skewness (mmm) 
> T=length(mmm) % Sample size 


> T 

[1] 2704 

> t3=s3/sqrt(6/T) % Skewness test 

¥ t3 

[1] 0.593333 

> pp=2*(1l-pnorm(t3)) % Compute p-value 


> pp 

[i] 0.5529583 % Cannot reject the null of symmetry. 

> s4=kurtosis (mmm) 

> t4=s4/sqrt(24/T) % Kurtosis test 

> t4 

[1] 49.15475 % Value is huge; reject the null. Has heavy tails. 


> normalTest (mmm,method='jb’) % JB-test 


Title: Jarque - Bera Normalality Test 
Test Results: 
STATISTIC: X-squared: 2422.4384 
P VALUE: Asymptotic p Value: < 2.2e-16 % Reject normality 


1.7 金融 数据 的 可 视 化 


在 分 析 金 融 数据 时 ， 图 示 法 是 一 个 有 用 的 工具 . 除了 前 面 显示 的 时 间 序 列 图 外 ， 本 
节 将 讨论 其 他 的 金融 数据 制图 方法 ， 为 了 获得 更 好 的 资产 收益 分 布 率 的 可 视 化 方法 ， 我 
们 检验 这 些 数据 的 直方 图 或 经 验 密 度 函 数 . 例如 ， 从 2001 年 1 月 2 日 至 2011 年 9 月 30 
日 3M 公司 股票 的 日 简单 收益 率 ， 共 2704 个 观测 值 ， 前 面 已 给 出 汇总 的 统计 数据 . 
图 1-11 显示 数据 的 直方 图 ， 它 通过 将 数据 划分 为 30 个 子 区 间 而 得 到 ， 由 图 1-11 可 知 ， 收 益 
率 曲 线 关 于 它 的 零 均值 对 称 ， 图 1-12 中 的 实 线 列 出 了 3M 公司 股 昧 收益 座 的 经 验 密度 函数 ， 
通过 用 非 参 数 的 平滑 方法 得 到 . 这些 经 验 密度 函数 可 以 视 为 下 方 图 的 一 个 精确 翻版 ， 图 1-12 
中 的 虚线 显示 了 3M 公司 股票 正 态 分 布 的 密度 函数 ， 它 们 具有 相同 的 均值 和 标准 差 ， 这些 时 
序 图 提供 了 3M 公司 股票 催 单 收益 率 正 态 假设 的 可 视 化 过 程 . 和 正 态 分 布 相 比 ， 经 验 密度 
阵 数 具有 更 高 的 峰值 和 更 厚 的 尾部 .这 种 现象 对 于 股票 收益 的 日 数据 来 说 很 沼 见 ， 一般 情 
况 下 ， 实 线 和 虚线 之 间 存 在 偏差 ,说明 3M 公司 股票 的 日 简单 收益 率 是 非 正 态 的 ， 这 和 我 
们 前 面 正 态 性 检验 的 结果 相 一 致 . 
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3M 公司 股票 的 日 简单 收益 率 的 直方 图 eoe o o 日 简单 收益 率 的 经 验 密度 
滑 数 ， 虚 线 是正 态 分 布 的 密度 函数 ， 它 们 
具有 相同 的 均值 和 标准 关 


为 了 研究 股票 的 价格 流动， 我 们 考虑 股票 的 日 开盘 价 、 最 高 价 、 最 低 价 和 收盘 价 . 
图 1-13 显示 苹果 公司 从 2011 年 1 月 3 至 6 月 30 日 股票 数据 的 时 序 图 ， 在 文献 中 该 图 称 为 
条 形 图 (Bar Chart). 我 们 使 用 R 脚本 ohlc.R 画 出 该 图 .该 脚本 的 修改 版 由 开 lemela 





《2009) 完 成 ， 在 图 1-13 中 ， 竖 线 表 示 日 股票 的 价格 范围 ， 竖 线 左 侧 水 平 线 上 的 点 给 出 了 股 
票 的 开盘 价 ， 右 边 给 出 了 收盘 价 ， 在 时 序 图 中 ,该 曲线 提供 的 信息 有 限 ， 无 法 给 出 太 多 的 
天 数 . 图 1-14 显示 从 2010 年 1 月 2 日 至 2011 年 12 月 8 日 苹果 公司 股票 的 日 收盘 价 ， 同 时 
也 给 出 了 过 去 21 个 交易 日 收盘 价格 的 移动 平均 ， 称 为 移动 平均 曲线 (moving-average 
chart). 这 里 使 用 21 天 是 任 选 的 ， 在 一 个 月 中 的 交易 日 是 个 粗略 的 数字 .移动 平均 曲线 提 
供 了 相对 最 近 的 历史 股价 信息 .在 统计 上 上， 移动 平均 是 减少 随机 小 动 的 一 个 简单 统计 方法 . 
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图 1-13 苹果 公司 从 2011 年 1 月 3 至 6 月 30 日 股票 数据 条 形 图 ， 坚 线 表 示 日 股票 的 价格 范围 ， 
竖 线 左 侧 水 平 线 上 的 点 给 出 了 股票 的 开盘 价 ， 右 边 给 出 了 收盘 价 
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Moving average plot 
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图 1-14 从 2010 年 1 月 2 日 至 2011 年 12 月 8 日 笠 采 公司 股票 日 收盘 价 ， 在 过 去 214 
交易 日 的 移动 平均 曲线 





对 于 多 个 资产 收益 率 ， 图 1-15 显示 了 从 1926 年 1 月 至 2011 年 9 月 ，IBM 公司 股票 和 
S&P 综合 指数 月 对 数 收益 率 的 时 序 图 ， 数 据 来 自 美国 股市 资料 库 (CRSP)， 除 了 经 济 大 莆 
条 (Great Depression) 时 期 外 ， 单 个 股票 的 收益 率 一 般 比 市 场 指数 存在 更 大 的 波动 . 在 时 序 
图 中 IBM 公司 的 股票 和 市 场 指数 收益 率 之 间 存 在 一 定 的 下 降 或 跳跃 . 图 1-16 显示 了 两 个 
对 数 收 益 率 的 散 点 图 (scatter plot). 散 点 图 还 显示 了 两 个 收益 率 的 最 小 二 乘 线 性 回归 . IE 
如 所 料 ，IBM 股票 和 市 场 指数 收益 率 之 间 有 正 的 相关 关系 . 这 种 线性 关系 可 以 度量 两 个 收 
益 率 之 间 的 相关 性 . 在 这 种 情况 下 ， 其 相关 系数 为 0. 64， 同时， 我 们 也 可 以 考虑 下 面 的 市 
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图 1-15 IBM 股票 和 标 普 (S&P) 综 合 指数 从 1926 年 1 月 至 2011 年 9 月 的 月 对 数 收益 率 时 序 图 
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场 模 型 (Market Model) 

=O i; TE 
XE, rn Mm TIRRAN A a KMAR, e 是 误差 项 .参数 a 表示 相 
对 于 市 场 收 益 的 超额 收益 ,PB 为 系数 . 对 于 IBM 股票 月 对 数 收 益 率 ， RIJA r= 0. 008 + 
0. 807m, te. 这 两 个 参数 在 5% 的 显著 性 水 平 下 通常 显著 不 为 零 ， 有 关 市 场 模 型 的 更 多 信 
A. ， 请 参阅 Sharpe(1964) 的 资本 资产 定价 模型 (Capital Asset Pricing Model, CAPM). 
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K] 1-16 M 1926 Æ 1 H 48 2011 Æ 9 H IBM 公司 股票 和 S&P 综合 指数 月 对 数 收益 率 的 散 点 图 ， 
实 线 是 两 个 收益 率 最 小 二 乘 线性 拟 合 





R 代码 演示 
library (fBasics) 
da=read.table("d-mmm-0111.txt",header=T) % Load data 
mum=da[{,2] $ Locate 3M simple returns 
hist (mmm,nclass=30) % Histogram 
di=density(mmm) % Obtain density estimate 
> range(mmm) % Range of 3M returns 
[1] -0.089569 0.098784 
> x=seq(-.1,.1,.001) % Create a sequence of x with increment 0.001. 
% The next command creates normal density 
> yl=dnorm(x,mean (mmm) , stdev (mmm) ) 
> plot (d1$x,dl$y,xlab='‘rtn’,ylab=‘density’,type='1’) 
> lines(x,yl1,lty=2) 
% ohlc plot 
library (quantmod) 
getSymbols("AAPL", from="2011-01-03", to="2011-06-30") 
X=AAPL[,1:4] % Locate open, high, low, and close prices 
xx=cbind(as.numeric(X[,1]),as.numeric(X[,2]),as.numeric(X[,3]), 
as .numeric(X[,4])) 
> source("ohlc.R") % Compile the R script 
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> Ohlc (xx,xl="days" ,yl="price" ,title="Apple Stock") 
% Moving average plot 
> source("ma.R") % Compile R script 
> getSymbols("AAPL", from="2010-01-02",to="2011-12-08"} 
> xl=as.numeric(AAPLSAAPL.Close) % Locate close price 
> ma(x1,21) 
% Bivariate and Scatter plots 
> da=read.table("m-ibmsp-2611.txt",header=T) 
> head (da) 
data ibm sp 
1 19260130 -0.010381 0.022472 
19260630 0.068493 0.043184 
ibm=log(da$ibm+1) % Transform to log returns 
sp=log(da$sp+1) 
tdx=c (1:nrow(da))/12+1926 % Create time index 
par (mfcol=c(2,1)) 
plot (tdx,ibm,xlab='year’,ylab='‘lrtn’,type=‘1’') 
title(main='(a) IBM returns’ ) 
plot (tdx,sp,xlab=‘year',ylab='Irtn',type='1l’) % X-axis first. 
title(main=‘(b) SP index’) 
> cor(ibm,sp) $ Obtain sample correlation 
[1] 0.6409642 
> ml=lm(ibm~ sp) % Fit the Market Model (linear model) 
> summary (m1) 
Call: lm(formula = ibm ~ sp) 
Coefficients: 
Estimate Std. Error t value Pr(>|t|) 
(Intercept) 0.007768 0.001672 4.645 3.84e-06 *** 
sp 0.806685 0.030144 26.761 < 2e-16 *** 
Residual standard error: 0.05348 on 1027 degrees of freedom 
Multiple R-squared: 0.4108, Adjusted R-squared: 0.4103 
> plot(sp,ibm,cex=0.8) % Obtain scatter plot 
> abline(0.008,.807) % Add the linear regression line 


1.8 一 些 统计 分 布 

在 文献 中 提 到 了 一 些 关 于 资产 收益 率 边际 分 布 的 统计 分 布 ， 包 括 正 态 分 布 、 对 数 正 态 
分 布 、 稳 态 分 布 、 正 态 分 布 的 尺度 混合 . 下 面 我 们 简要 地 介绍 这 些 分 布 . 
1.8.1 正 态 分 布 

在 金融 研究 中 ， 传 统 的 假设 是 : 简单 收益 率 (Ri | 二 1，…，T} 是 独立 同 分布 (inde- 
pendently and identically distributed，iid)， 且 都 服从 一 个 固定 均值 和 方差 的 正 态 分 布 . 这 
个 假设 使 得 资产 收益 率 的 统计 性 质变 得 易于 人 处理， 同时 也 遇 到 了 几 个 困难 : 第 一 ， 人 简单 资 
产 收益 率 的 下 界 为 一 1， 而 正 态 分 布 可 以 取 实 轴 上 的 任意 值 ,， 没有 下 界 ; B, WR R: Æ 
正 态 分 布 ， 那 么 多 期 的 简单 收益 率 Ri Lj 是 单 期 收益 率 的 乘积 ,不 再 是 正 态 分 布 ; 第 三 ， 
很 多 资产 收益 率 都 存在 正 的 超额 峰 度 ， 因 为 很 多 实证 结果 均 不 支持 正 态 性 的 假设 . 


1. 8.2 对 数 正 态 分 布 


为 一 个 第 用 的 假定 是 : 资产 的 对 数 收 益 认 7, 是 独立 同 分 布 ， 且 服从 一 个 均值 为 yy、 方 
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差 为 o WESS. Ai KEM a AY HT ACE AS BEL BE ge. REMSEN 
ECR,) = expla +2) —1, Var(R,) = exp(2u+o’)Lexp(o’) —1] (1-14) 
这 两 个 等 式 在 研究 资产 收益 率 时 常用 (如 在 用 对 数 收益 率 建 立 的 模型 进行 预测 时 )， 反之 ， 


假设 简单 收益 率 R, 服从 对 数 正 态 分 布 ， 其 均值 为 mm， 方差 为 mz;， 则 相应 的 对 数 收益 率 r, 
的 均值 和 方差 分 别 为 





ml | 


7 ero 


因为 有 限 个 独立 同 分 布 的 正 态 随机 变量 之 和 仍 服 从 正 态 分 布 ， 所 以 在 {7,} 是 正 态 分 布 
假设 下 ，r,L&j 也 服从 正 态 分 布 ， 男 外 ,7 没有 下 界 ， 由 1 十 R, 王 exp(7,)， 可 得 R, 的 下 界 . 
然而 ， 对 数 正 态 分 布 的 假设 与 历史 股票 收益 率 的 所 有 性 质 并 不 都 相符 ， 很 多 股票 收益 率 表 
现 出 具有 正 的 超额 峰 度 . 


1.8.3 ADH 
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态 分 布 是 正 态 分 布 的 自然 推广 ， 它 们 在 加 法 运算 下 是 稳定 的 ， 这 一 点 满足 连续 复合 
Ps 的 要 求 ， 而 且 ， <a 25» o as 9 rs He aR 然 
而 ， 非 正 态 的 稳 态 分 布 没 有 有 限 方差 ， 这 一 点 与 大 部 分 金融 理论 相 矛 盾 . 为 外 ， 用 非 正 态 
的 稳 态 分 布 进行 统计 建 模 是 很 困难 的 . 非 正 态 稳 态 分 布 的 例子 是 柯 西 分 布 (Cauchy distri- 
bution) ， 它 关于 目 己 的 中 位 数 对 称 ， 但 其 方差 是 无 限 的 . 


1.8.4 正 态 分 布 的 尺度 混合 


在 最 近 股 票 收 益 率 人 研究 中 ， 人 们 倾 铝 于 利用 正 态 分 布 的 尺度 混合 或 有 限 混 合 。 在 正 态 
分 布 的 尺度 混合 假定 下 ， 对 数 收益 率 7, 服从 均值 为 uy、 方差 为 o 的 正 态 分 布 ( 即 7,~N(y， 
o°)). (A. o 是 一 个 随机 变量 ,服从 一 个 正 的 分 布 ( 如 co “服从 一 个 Gamma 分 布 )， 正 态 
分 布 的 一 个 有 限 混 合 的 例子 为 
r, ~ (1—X)N(p.034) + XN Cus 02) 
其 中 ，X 是 一 个 服从 Bernoulli 分 布 的 随机 变量 ， 即 PCX=1)=a, P(X=0)=1-a, H 
0<a<1， 这 里 ci 较 小 ， 而 c 相 对 较 大 . 例如， 对 a 二 0.05， 有 限 混 合 分 布 指出 95% 的 收益 
KRMA Nu, ci), WA 5% 的 收益 率 服从 Nu, o2). 0; 的 较 大 值 能 使 混合 分 布 把 更 多 的 
异常 值 放 在 其 分 布 的 尾部 . NC，o3) 的 收益 率 的 百分比 较 低 ， 说 明 大 多 数 收益 率 服从 
一 个 简单 的 正 态 分 布 ， 混合 正 态 分 布 的 优点 是 它们 保持 了 正 态 分 布 的 多 处 理性 、 具 有 有 限 高 
阶 矩 且 能 刻画 这 些 超 额 峰 上 度 . a 我 们 很 难 估 计 其 混合 参数 (如 有 限 混 合 分 布 中 的 参数 a). 
图 1-17 显示 的 是 有 限 混合 正 态 分 布 、 柯 西 分 布 和 标准 正 态 分 布 的 概率 密度 函数 . 有 限 
et ii 1+XN(O, 16), HH X 是 一 个 Bernoulli 随机 变量 ， 
P(X=1)=0. 05. 柯 西 分 布 的 密度 函数 是 
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可 见 ， 柯 西 分 布 比 有 限 混 合 的 正 态 分 布 具 有 更 厚 的 尾部 ， 而 有 限 混合 的 正 态 分 布 比 标 
准 正 态 分 布 存在 更 厚 的 尾部 . 
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图 1-17 有 限 混合 的 正 态 分 布 、 稳 态 分 布 和 标准 正 态 分 布 密度 函数 之 间 的 比较 


1.8.5 多 元 收益 率 


Wr= Cus ts rw) 是 NN 个 资产 在 t 时 刻 的 对 数 收 益 率 ， 多 元 分 布 关心 fr,}) 三 的 联合 
分 布 ， 在 序列 相关 性 存在 的 情况 下 ， 统 计 分 析 主 要 集中 在 条 件 分 布 函 数 FC, ra’ es 
r1，0) 具 体形 式 的 设 定 上 . 尤其 是 ， 在 投资 组 合 和 风险 管理 中 ， 人 们 最 关心 的 是 x, 的 条 件 
期 望 和 条 件 协 方差 矩阵 随时 间 怎 样 变化 . 

随机 向 量 X=(X ，…，X,) 的 均值 向 量 和 协 方差 矩阵 定义 为 

E(x) = u, = [EC(X),…,E(X,)] 
Cov(x) = X, = EL (x—p,.) (x —p,)'] 
假设 X 的 期 望 存在 ， 当 XE{(z ，…，xr} 时 ， 样 本 均值 和 样本 协 方差 矩阵 定义 为 


~ 


f= 二 > Ê. = FD hd Bo 
假设 X 的 协 方差 矩阵 存在 ， 那 么 这 些 样本 统计 量 都 是 它们 理论 上 的 一 致 估计. 在 金融 文献 
中 ， 多 元 正 态 分 布 常 用 其 对 数 收益 率 r, 来 表示 . 
为 了 证 明 这 一 点 ， 下 面 考 虑 IBM 股票 和 S&P 500 综合 指数 的 月 对 数 收益 率 ( 从 1926 年 1 
月 至 2011 年 9 月 )， 如 图 1-16 所 示 . $ r,= Cy. ra), XE r Ar. 4H IBM 股票 和 
S&P 500 综合 指数 的 月 对 数 收 益 率 ， 共 有 1029 个 观测 值 . 则 r 的 样本 均值 和 协 方差 矩阵 为 
0. 0113 、 4849 2470 
a= [ool £=] x10 
0. 0044 2470 3062 
要 检查 二 元 正 态 假设 的 有 效 性 ， 可 以 使 用 统计 模拟 的 方法 .从 一 个 二 元 正 态 分 布 中 ， 
我 们 产生 了 1029 个 数据 ， 其 均值 为 应 ， 协 方差 矩阵 为 三. 在 及 添加 包 中 ， 可 以 使 用 
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mnormt 中 的 rmnorm 命令 来 实现 .图 1-18 显示 了 模拟 过 程 的 散 点 图 ， 通过 比较 图 1-18 和 
图 1-16 中 的 散 点 图 ， 我 们 发 现 这 两 个 时 序 图 之 间 存 在 着 显著 的 差异 ， 这 就 表明 这 里 的 正 态 
性 假设 是 值得 商 椎 的 . 

R 代码 演示 

> da=read.table("m-ibmsp-2611.txt",header=T) % Load data 

> dim(da) 


(1) 1029 3 
> ibm=log(da$ibm+1) % Compute log returns 











> sp=log(da$sp+1) 
> rt=cbind(ibm,sp) % Obtain bivariate returns 
> ml=apply(rt,2,mean) % Obtain sample means 
> vil=cov(rt) % Obtain sample covariance matrix 
> ml 

ibm sp 
0.011303024 0.004381644 
> v1 

ibm sp 


ibm 0.004849390 0.002469738 

sp 0.002469738 0.003061590 

> library(mnormt) % Load package 

> x=rmnorm(1029,mean=ml1l,varcov=vl) $% Simulation 

> dim(x) 

[1] 1029 2 

> plot (x[,2],x[,1]),xlab='sim-sp’ ,ylab=‘sim-ibm’ , cex=0.8] 


sim—ibm 





bo! 


-0.] 0.0 0.1 0. 


sim—sp 


图 1-18 根据 二 元 正 态 分 布 模拟 产生 的 1029 个 数据 的 散 点 图 ， 该 二 元 正 态 分 布 基 于 IBM 股票 
和 标 普 CS&P) 综 合 指数 的 月 对 数 收益 率 的 样本 均值 和 协 方差 
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1. 考虑 从 2001 年 9 月 1 日 到 2011 年 9 月 30 日 美国 运通 公司 (AXP)、CRSP 价值 权重 指数 (VW)、CRSP 
的 等 权重 指数 (EW) 以 及 S&P 综合 指数 的 日 简单 收益 率 . 收益 率 中 包含 有 支付 的 股息 . 数据 来 自 
d-axp3dx-0111. txt(date, axp, vw, ew, sp). 

Ca) 计算 每 个 收益 率 序列 的 样本 均值 、 标 准 差 、 偏 度 、 超 额 峰 度 、 最 大 值 和 最 小 值 . 

Cb) 把 简单 收益 率 转换 成 对 数 收益 率 ， 计 算 每 个 对 数 收益 率 的 样本 均值 、 标 准 差 、 偏 度 、 超 额 峰 度 、 
最 大 值 和 最 小 值 . 

Co) 对 AXP 股票 的 对 数 收益 的 均值 等 于 零 的 原 假设 进行 检验 .在 5% 的 显著 性 水 平 下 ， 得 出 你 的 结论 . 

2. 考虑 从 1940 年 1 月 到 2011 年 9 月 通用 电器 (GE)、CRSP 价值 权重 指数 (VW)、CRSP 等 权重 指数 
(EW) 以 及 S&P 综合 指数 的 月 收益 率 数据 ， 重 新 回答 习题 1 中 的 所 有 问题 ， 这 里 收益 率 中 包含 有 股息 ， 
数据 来 自 m-ge3dx-4011. txt(date, ge, vw, ew, sp). 

3. SIEM 1940 Æ 1 AB 2011 Æ 9 A S&P 综合 指数 的 月 股票 收益 率 ， 进 行 下 面 的 检验 ， E 5% BY SE 
水 平 下 得 出 你 的 结论 . 

Ca) 检验 假设 Ho : yy 一 0， 其 备 择 假设 为 At p70, OB 是 收益 率 的 均值 . 
Cb) 检验 假设 Ay tm =0, HAAREN H, : m #0, XE m 是 收益 率 的 偏 度 . 
(c) 检验 假设 Ho? K 二 3， 其 备 择 假设 为 H, : KA3, 这 里 K 是 收益 率 的 峰 度 . 

4. 再 次 考虑 习题 1 中 美国 运通 公司 从 2001 年 9 月 1 日 到 2011 年 9 月 30 日 股票 的 日 对 数 收益 率 ， 在 5% 
的 显著 性 水 平 下 ， 进 行 下 述 假设 检验 : 

Ca) 原 假设 是 : WNC a Kh Did BE RE te SGP 
Cb) 原 假 设 是 : 收益 的 超额 峰 度 等 于 雪 . 

5. 从 芝加哥 的 联邦 储备 银行 得 到 日 汇率 ， 数 据 是 经 过 纽约 联邦 储备 银行 认证 的 纽约 市 每 日 中 午 买 人 价 . 
考虑 从 2007 年 1 月 2 日 到 2011 年 11 月 30 日 美元 对 和 英镑、 日 元 的 汇率 ， 这 些 数据 可 以 从 网 站 下 载 . 
计算 : 

Ca) 每 个 汇率 的 日 对 数 收益 率 . 

Cb) 汇率 的 日 对 数 收 益 率 的 样本 均值 、 标 准 差 、 偏 度 、 超 额 峰 度 、 最 大 值 和 最 小 值 . 

Cc) 画 出 美元 /日 元 汇率 的 日 对 数 收益 率 的 密度 函数 . 

Cd) 检验 假设 Ho : u50, HAAREN H. : p70, HE u 表示 美元 /日 元 汇率 的 日 对 数 收益 率 的 均 
值 . 在 5% 的 显著 性 水 平 下 给 出 你 的 结论 . 
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第 2 章 金融 时 间 序 列 的 线性 模型 


在 这 一 章 中 ， 我 们 讨论 金融 时 间 序 列 建 模 和 预测 中 有 用 的 方法 和 线性 模型 .我 们 应 用 
实例 来 介绍 一 些 重要 的 统计 概念 ， 并 一 步 步 地 进行 数据 分 析 ， 同 时 讨论 它们 在 金融 中 的 应 
用 .线性 时 间 序 列 分 析 的 基本 概念 ， 参 见 Tsay(2010， 第 2 章 )、Box 1994, 第 2 章 和 
第 3 章 )、Brockwell 和 Davis(2002， 第 1~3 音 )、Shumway 和 Stoffer(2000) 以 及 Wood- 
ward 等 (2012). 

本 章 介 绍 的 模型 包括 : 1) 简 单 自 回 归 (AR) 模 型 ;， 2) 简单 移动 平均 (MA ) 模 型 ; 3) 混 合 
日 回归 移动 平均 (ARMA) 模 型 ; 4) 包 含 单 位 根 检验 的 单位 根 模型 5) 指数 平 请 模型 ;6) 季 
市 模 型 ; 7) 禹 时 间 序 列 误差 的 回归 模型 ; 8) 对 长 期 相依 性 的 分 数 阶 差 分 模型 .对 每 一 个 模 
型 ， 我 们 学 习 它 们 的 基本 性 质 ， 包 括 模 型 选择 方法 、 产 生 预 测 的 方式 并 讨论 它们 的 应 用 . 
本 章 也 讨论 了 如 何 比 较 不 同 的 模型 ， 例 如 回 测 检 验 和 模型 平均 预测 . 

设 {zi} 是 与 时 间 有 关 的 金融 度量 的 集合 ,图 2-1 给 出 了 从 2003 年 1 月 3 日 到 2010 年 4 月 
5 日 期 间 毕 有 末 公 司 股票 的 日 收盘 价 . 图 2-1 显示 日 收盘 价 有 茶 种 程度 的 波动 性 ， 并 在 取样 区 
间 内 有 一 个 同上 的 运动 趋势 . 图 2-2 给 出 了 1983 年 到 2009 年 可 口 可 乐 公 司 每 股 股票 的 季 
RELA. 图 2-2 中 标 出 了 具体 的 季度 . 除了 有 问 上 的 趋势 外 ， 收 益 也 同时 显示 有 明显 的 年 
度 模式 ， 这 在 时 间 序 列 中 称 为 季节 性 (seasonality). 后 面 将 看 到 ， 许 多 经 济 和 金融 时 间 序 
列 呈 现 明显 的 季节 趋势 .图 2-3 给 出 了 标 普 500(S&P 500) 指 数 在 1926 年 1 月 到 2009 年 12 
月 的 月 对 数 收益 率 . 从 图 2-3 中 可 以 看 出 ， 收 益 率 在 0 值 周围 流动， 并 且 除 了 少数 几 个 极端 
值 以 外 ， 它 们 都 在 一 个 固定 范围 内 波动 ， 图 2-4 给 出 了 两 个 时 间 序 列 ， 它 们 分 别 是 美国 3 月 
期 和 6 月 期 国 俩 在 1959 年 1 月 2 日 到 2010 年 4 月 16 日 的 周 利率 .这 些 利率 取 目 二 级 市 场 . 
其 中 ,图 2-4 的 上 图 是 6 月 期 国 俩 利率， 下 图 是 3 月 期 国 俩 利率 . 两 个 利率 序列 的 移动 模式 
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Al 2-1 苹果 公司 股票 在 2003 年 1 月 3 日 到 2010 年 4 月 5 日 期 间 的 日 收盘 价 
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近似 ， 但 是 也 呈现 出 某 种 差异 . 如 预期 的 那样 ，6 月 期 国债 利率 通常 高 于 3 月 期 ， 但 是 在 
某 些 时 期 上 ，3 月 期 的 国债 利率 较 高 ， 例 如 20 世纪 80 年 代 的 早期 ， 在 上 述 4 个 例子 中 ， 
序列 x, 大 致 上 是 在 相等 分 隔 的 时 间 区 间 上 观测 的 . 这 种 现象 在 利率 期 限 结构 中 被 称 为 收益 
率 曲 线 倒挂 . 这 4 个 序列 就 是 本 章 要 分 析 的 金融 时 间 序 列 的 例子 .我 们 的 目的 是 学 习 序 列 
的 动态 相依 性 ， 据 此 对 序列 做 出 适当 的 推断 . 
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图 2-2 可 口 可 乐 公 司 在 1983 年 第 1 季度 到 2009 年 第 3 季度 每 股 股 票 的 季度 鳃 利 
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图 2-3 brie 500 指数 在 1926 年 1 月 到 2009 年 12 月 间 的 月 对 数 收益 率 
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图 2-4 上 图 是 6 月 期 国债 的 利率 ， 下 图 是 3 月 期 国债 利率 


2. 1 平稳 性 


在 时 间 序 列 分 析 中 ， 统 计 推 斯 的 基础 是 弱 平 稳 性 的 概念 ， 如 图 2-3 中 给 出 的 标 普 500 
指数 序列 ， 该 序列 随时 间 在 0 值 上 下 变化 . 事实 上， 可 以 把 整个 时 间 区 间 划 分 为 几 个 子 区 
间 ， 这 些 子 区 间 的 样本 均值 都 应 该 接近 0 fA. 在 统计 上 ， 这 种 现象 表明 收益 率 的 均值 不 随 
时 间 变 化 ， 或 者 简单 地 说 ， 期 望 收 益 率 具有 时 间 不 变性 而且， 图 2-3 也 说 明 ， 在 样本 数 
据 时 间 路 度 内 ， 除 了 大 瑚 条 时 期 外 ， 月 对 数 收 益 率 的 范围 大 约 在 区 间 [L 一 0.2，0.2j4， FEB 
计 上 ， 该 特征 表明 对 数 收 益 率 的 方差 不 随时 间 变 化 . 把 这 两 个 时 间 不 变性 特征 结合 在 一 
起 ， 我 们 称 对 数 收益 率 序列 {z, } 为 弱 平稳 的 (weakly stationary). 正式 地 说 ， 如 果 一 个 时 间 
序列 z, 的 一 阶 矩 和 二 阶 矩 ( 即 均值 和 方差 ;5 具有 时 间 不 变性 ， 则 称 它 为 弱 平 稳 的 . 弱 平 稳 性 
是 很 重要 的 ， 因 为 它 为 预测 提供 了 基础 框架 . 对 于 标 普 500 指数 的 月 对 数 收益 率 ， 我 们 有 
充分 的 理由 预测 未 来 的 月 收益 率 大 约 在 0 值 左右 ， 并 且 在 一 0.2 一 0.2 之 间 变 化 . 

为 一 方面 ， 考 虑 图 2-2 中 可 口 可 乐 公司 每 股 股 票 的 季度 组 利 数据 ， 如 果 把 取样 时 间 区 
间 分 割 为 几 个 子 区 间 ， 这 些 子 区 间 上 的 样本 均值 就 有 显著 的 不 同 . 所 以 ， 该 借 利 序列 不 是 
弱 平 稳 的 ， 这 里 没有 令 人 恢 讶 之 处 ， 因 为 一 家 优秀 公司 的 季度 盘 利 随时 间 而 提高 是 符合 我 
们 的 预期 的 .图 2-2 的 时 序 图 也 表明 鳃 利 的 波动 性 随时 间 而 增加 . 故此， 季度 鳃 利 的 方差 
也 是 随时 间 变 化 的 .基于 以 上 原因 ， 季 上 度 鱼 利 序 列 不 是 弱 平 稳 的 .我们 将 在 后 面 讨论 对 这 
种 非 平稳 序列 进行 建 模 的 方法 和 模型 . 

在 讨论 弱 平 稳 性 时 ， 我 们 隐 含 地 假定 了 z, 的 前 两 阶 窍 是 有 限 的 .为 了 容易 表述 ， 我 们 
把 xz, 的 均值 和 方差 分 别 记 为 E(xz,) 二 yj 和 E(x 一 1)? 二 7,. 由 于 这 两 个 统计 量 是 和 常数， 所 以 
它们 不 随时 间 变 化 ， 可 以 分 别 用 两 个 简单 记号 jy 和 Yo 来 表示 . 

平稳 时 间 序 列 有 其 他 重要 的 性 质 ， 对 给 定 的 整数 &， 称 协 方差 Ye = Cova, z) WN 
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x, 的 间隔 为 & 的 目 协 方差 . 应 用 柯 西 - 施 瓦 次 (Cauchy-Schwarz) 不 等 式 ， 容 易 证 明 六 存在 
并 且 也 具有 了 时间 不 变性 . 也 就 是 说 ， 对 一 个 轮 平 稳 的 时 间 序 列 a y MIR k, WE 
衡量 x, Ma, 的 线性 相依 性 .或 者 说 ， 它 衡量 x, 对 它 的 过 去 取 值 z, 一 的 动态 相依 性 线 
性 时 间 序 列 分 析 痢 重 研究 序列 x, 的 动态 相依 性 . 目 协 方差 n 具有 两 个 重要 性 质 : DH = 
Var(z); 2y.=%. BPH Mor. AW y_.=Covlaz,, £p ) = Cov ltp, 2) = 
Coyle = COV, « a) is JOP oe. 


2.2 相关 系数 和 目 相 关 范 数 


图 2-5 给 出 了 IBM 股票 的 月 简单 收益 率 和 标 普 500 指数 的 散 点 图 ， 这 两 个 收益 率 看 起 
来 是 正 相关 的 ， 线 性 相关 的 程度 经 常用 皮尔 过 (Pearson) 相 关系 数 (或 者 简称 为 相关 系数 ) 来 
衡量 .在 统计 上 ， 两 个 随机 变量 X 和 了 的 相关 系数 定义 为 
_ Cov E (YY — a] 
有 
其 中 jy, 和 As 分 别 表示 X 和 YY 的 均值 ， 并 且 假 定 方差 是 有 限 的 ， 这 个 系数 度量 的 是 X 和 Y 
线性 相依 的 程度 ， 可 以 证 明 一 1 过 py 志 1 H ons = pre FE ps 一 0， 则 这 两 个 随机 变量 是 不 
相关 的 ， 另外， 如果 X 和 YY 都 是 正 态 随 机 
变量 ， 则 ons =0 当 且 仅 当 X 和 YY 是 相互 独 
立 的 . 
当 我 们 有 样本 {(z ，y ) =l, + D) 
时 ， 相 关系 数 可 以 由 它 对 应 的 样本 相关 系数 
相合 地 估计 出 来 : 


X ri — T) (y: — F) 























IBM stock returns 








> ry > oa 
Hp a = 》)z/T 和 y = >) y./T Hide X 


和 YY 的 样本 均值 . S&P index returns 
注 记 : 理论 上 ,皮尔 过 相关 系数 取 值 为 ”图 2-5 IBM 股票 的 标 普 500 指数 的 月 度 简单 收 
一 1] 一 1 之 间 . 然而 ， 对 某 些 随机 变量 而 言 ， 益 率 的 散 点 图 时间 区 间 是 从 1967 年 1 
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该 系数 的 实际 范围 比较 小 ， 文 献 中 也 给 出 了 A 


其 他 的 衡量 相依 性 的 度量 指标 ， 其 中 最 流行 的 两 个 是 斯 皮尔 曼 (Spearman)rho Fe + 48 R 
(Kendall)tau. 因为 斯 皮尔 曼 rho 是 基于 边际 变量 秩 的 相关 系数 ， 所 以 它 又 称 为 斯 皮尔 曼 
秩 相 关系 数 . HIER tao 则 反映 了 一 致 数 对 和 非 一 致 数 对 的 差别 .假设 (XI!，Y1) 和 (X,， 
YY: ) 是 两 个 独立 同 分 布 的 二 元 连续 随机 变量 . HER tau 的 定义 如 下 : 

和 一 (一 一 过 0 
为 了 说 明 上 面 的 概念 ， 考 虑 图 2-5 中 的 散 点 图 两 个 月 简单 收益 的 皮尔 逊 相 关系 数 为 





a #2# 





0. 5857. 斯 皮尔 曼 rho Ą 0.5861, m #48% tau Ą 0.4196. 2 
R 代码 演示 

da=read.table("m-ibmsp6709.txt", header=T! 

head ida) 


date ibm sp 
19670131 0.075370 0.078178 


W 


y 


k= 


6 19670630 0.067024 0.017512 

> ibm=daSibm 

> spS=daSsp 

> cor(sp5,1bm) 

[1] 0.5856544 

> cor(sp5,ibm,method='‘spearman’ ) 
11] 0.5860817 

> cor(sp5,ibm,method=‘kendall') 
[1] 0.4196587 


H AH X Ph Be 

7G EI F fa Vi] eS) zx,. zi Fp oe, TK RARAN x, 的 间隔 为 & 的 自 相 关 (lag- 
autocorrelation) 系数 ， 通 常 记 为 o. 具体 地 说 ， 其 定义 为 

n= Cov Game | CEt) _ Ne (2-1) 
-Var E Bese) 7yo 

因为 xz, 为 弱 平 稳 的 ， 所 以 这 里 有 Varl) =Varlx,). 根据 定 义 ， 我 们 有 o=1, =p- 
和 一 1 全 ps 三 1. 目 相关 系数 组 成 的 集合 (oi) 称 为 x, W A t Až Autocorrelation Func- 
tion, ACF). 一 个 弱 平 稳 时 间 序 列 zx, 是 序列 自身 前 后 不 相关 的 ， 当 且 仪 当 对 所 有 二 0 都 
有 on =0. 


对 一 个 给 定 的 样本 {x， 上 一 |， F, ‘ee 设 元 为 样本 均值 ， Bp 5 > ° 则 i 的 间 
隅 为 1 的 样本 目 相 关系 数 为 








>, 21 — T) a — T) 


01 — t=2 - 
> Ci =z)” 
t=1 


在 通常 条 件 下 ,Pb 是 w 的 相合 估计 ， 例如， 车 {x,) 是 独立 同 分 布 随 机 变量 序列 且 Ea <9, 
WIJ o oie 斤 地 服从 均值 为 0、 方 差 为 1/ 工 的 正 态 分 布 ( 见 Brockwell 和 Davis(2009) 中 的 定理 
7.2.2). 一般 地 ，z 的 间隔 为 & 的 样本 自 相 关系 数 定义 为 
六 
=? OO A] OD 
Dy ao 

右 4z,} 是 一 个 独立 同 分 布 随机 变 : 量 序列 ， WE El) <o, WIERE EWER Z k, o 渐 
近 服 从 均值 为 0、 方 差 为 1/T HESSE. TE Ær FE PRR. E x, = 


u+ Dipan, 其 中 yh 一 1，{a) 是 均值 为 0 的 独立 同 分 布 随机 变量 序列 ， 则 对 于 kas i 
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WT EAR IA HOA 0, FAA (1+ 2D) oF) / 工 的 正 态 分 布 ， 在 时 间 序列 文献 中 这 个 结果 称 
为 Bartlett 公式 (参见 Box 等 (1994))， 关 于 样本 自 相 关 函 数 的 渐 近 分 布 的 更 多 信息 ， 参 








WL FEuller(1995， 第 6 Æ) #l Brockwell 和 Simple returns 
Davis(2009). a 
Gl 2.1 考虑 CRSP 的 第 10 分 位 组 合 Es 
的 月 简单 收益 率 ， 时 间 为 1967 年 1 月 到 a 
2009 年 12 月 .共计 516 个 观测 值 ， 即 T= | 1970 1980 Rig 2000 2010 


516. 该 投资 组 合 由 NYSE/AMEX/NAS- a) 收益 这 的 时 序 国 
DAQ 市 值 最 小 的 10% 股 票 构成 ， 并 且 每 年 Series dl0 

都 重新 平衡 ， 图 2-6a 给 出 了 收益 率 序列 的 
时 序 图 ， 而 图 2-6b 是 序列 的 样本 ACF. 在 
ACF 图 中 的 两 条 水 平 线 代 表 2 个 标准 误差 
的 上 下 限 ， 即 士 2 /T. ACF 图 从 Po 一 1 开 





ACF 





Lag 


te. 图 2-6 清楚 地 表明 ， 在 5%% 的 水 平 上 间 b) 收益 率 的 样本 自 相关 函数 ACE 








隔 为 1 的 ACK 是 显著 不 等 于 0 的 . 分 析 中 图 2-6 1967 年 1 月 到 2009 年 12 月 的 CRSP 第 10 
FASE R 命令 如 下 : 分 位 组 合 的 月 简单 收益 率 

> da=read.table("m-dec12910.txt",header=T) 

> head (da) 

date decil dec2 dec¥ decl10 

1 19670131 0.068568 0.080373 0.180843 0.211806 

219670228 0.008735 0.011044 0.048767 0.064911 

> dli0=daSdec10 # select the Decile 10 returns 

> decl0=ts(d10, frequency=12,start=c(1967,1)) 

> par (mfcol=c(2,1)) 

> plot (decl10,xlab='year’ ,ylab=‘returns') 

> title(main=‘(a): Simple returns’ ) 

> acf(d10,lag=24) # command to obtain sample ACF of the data 


检验 单个 ACF 
对 一 个 给 定 的 正 整数 &， 可 用 前 面 的 结果 来 检验 H : wm =0 对 H : ox 闫 0， 检 验 统计 量 为 ， 
tt = — 2A 
(1+2 ») a) /T 
WAR (x, } eK BS AY rea re SP HE >k T op =O, WK t E Ce ratio) 4 ir He He MM tp HE TE AS 
分 布 . 所以， 决策 规则 是 : 当 |t 比 | 二 Zi; 时 拒绝 A. FEZ... 是 标准 正 态 分 布 的 10001 — 
gq/2) 百 分 位 分 位 点 男 外 ， 也 可 以 用 上 述 统计 量 1 比 的 p 值 来 得 出 结论 .如 果 p 值 小 于 第 了 I 
类 错误 值 ， 例 如 0.05, 那么 就 拒绝 原 假 设 . 如果 p EK ae ETB 工 类 错误 值 ， 那 么 就 
不 能 拒绝 原 假 设 Ho. 
为 了 丛 单 起 见 ， 对 于 任意 & 和 0， 许 多 软件 用 17 工作 为 cs 的 渐进 方差 . 那么 上 比 就 变 为 
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VT be. 该 简单 近似 实质 上 是 假定 所 分 析 的 时 间 序 列 是 一 个 独立 同 分 布 随 机 变量 序列 . 

例 2.1( 续 ) 在 美国 ， 小 市 值 股票 倾 回 在 1 月 有 一 个 正 收益 率 ， 这 可 能 由 于 多 种 原因 ，， 
例如 税收 考虑 ， 或 者 年 终 的 组 合 调整 . 这 称 为 小 市 值 股票 的 1 月 效应 (January effect). 一 
种 验证 小 市 值 股 票 1 月 效应 存在 性 的 方法 是 应 用 例 2. 1 中 CRSP 组 合 的 最 低 10 分 位 的 月 简 
单 收益 率 来 进行 假设 检验 : 

原 假设 Hot op 一 0 和 备 择 假 设 H pw A0 
从 数据 中 ,我们 计算 得 到 61; 二 0.13， 应 用 1/VT 作 为 ;的 标准 误差 的 渐进 估计 ， 我 们 得 
到 zz 比 z 二 VT61 二 2.96， 它 大 于 5% 的 临界 值 1. 96. 所 以 ,我 们 拒绝 原 假 设 ， 即 在 5% 
显著 性 水 平 下 oi 二 0. 换 句 话说 ， 数 据 证 实 了 小 市 值 股票 收益 率 1 月 效应 的 存在 性 . 
R 代码 演示 
> fl=acf (dl10, lag=24) 





> ft1isacft 
[1,] 1.000000000 # lag-0O 
[2,] 0.227386585 # lag-1 
[13,] 0.130411045 # lag-1z 
[14,] -0.036881195 # lag-12 
> tt=f£1Sacf[13] *sqrt (516) 
> CC 
[1] 2.962369 


| 

对 有 限 样本 ，p 是 pi WA mA. Wa AEE Te LT, TERE AS AS Be 工 较 小 的 时 候 是 不 
容 忽 视 的 .但 在 大 多 数 金 融 应 用 中 ， 了 工 相 对 较 大 ， 故 这 个 偶 差 并 不 严重 . 

混成 检验 

由 式 (2-2) 所 定义 的 统计 量 0; o RRN zx, 的 样本 上 自 相关 函数 (ACF). 这 个 函数 在 线 
性 时 间 序 列 分 析 中 起 着 重要 作用 .事实 上 ， 一 个 线性 时 间 序 列 模型 可 以 完全 由 其 ACF 来 刻 
画 ， 并 且 线 性 时 间 序 列 的 建 模 用 样本 ACF 来 决定 数据 的 线性 动态 关系 . 在 许多 金融 应 用 
中 ， 我 们 经 并 需要 联合 检验 xz, 的 多 个 目 相 关系 数 是 否 同 时 为 0. Box 和 Pierce(1970) 提 出 
了 混成 统计 量 (Portmanteau statistic) 











Q. (m) = D oi 
来 检验 原 假 设 Hot pi = + =p, =0 对 备 择 假设 H. op AOGE (1, +, mj). 在 {x,) 是 满足 
一 定 矩 条 件 的 iid 随机 序列 的 假定 下 ，Q; Com) 渐 近 地 是 自由 度 为 六 的 六 随机 变量 . 
为 了 提高 有 限 样本 中 检验 的 功效 ，Ljung 和 Box(1978) 把 统计 量 Q. (mm) 修 改 成 
Qim) = T(T+2) >) z% (2-3) 
决策 规则 是 : 当 QUm) > xX, 时 拒绝 HL. HR Xx。 是 自由 度 为 m 的 X 分 布 的 100(1 一 a) 百 分 
位 分 位 点 . 大 部 分 软件 包 都 会 给 出 QCm) 的 p 值 ， 决 策 规则 是 当 p 值 小 于 第 I 类 错误 或 者 
显著 性 水 平 a 时 ， 拒 绝 Hs. 
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Hil 2.2 考虑 IBM 股票 从 1967 年 1 月 到 2009 年 12 月 的 月 简单 收益 率 和 对 数 收益 率 ， 样 
本 容量 是 516. 图 2-7 给 出 了 IBM 股票 的 简单 月 收益 率 和 对 数 收益 率 的 样本 目 相 关 函 数 . 这 
两 个 样本 目 相 关 郧 数 非常 接近 ， 它 们 都 在 2 倍 的 标准 误差 范围 内 ， 这 表明 IBM 股票 月 收益 率 
序列 即使 存在 某 种 相关 性 ， 该 自 相 关 性 也 是 很 小 的 . we 列 目 相关 
性 ， 我 们 检验 Ho : m =H = =p, =0 对 H, * op AOGE{1, ...m}), HR m=12 和 24. 
对 于 简单 收益 率 ， 我 们 有 Q(12) 二 7. 57， 其 户 值 为 0.82; Q(24) 一 25. 49， 其 对 应 的 p 值 为 
0. 38， 对 于 对 数 收 益 率 ，Q(12) 二 7.40，Q(24) = 25.49, EMME p wl 0.83 和 
0.38. 因此，Ljung-Box 统计 量 不 能 拒绝 IBM 股票 收益 率 没 有 显著 的 前 后 相关 性 这 一 原 假 设 . 

R 代码 演示 
da=read.table("m-ibmsp67093.-txt",header=T) 
ibm=daSibm 
Inibm=log(ibm+1) # Transfer to log returns 
Box.test (ibm, lag=12,type=‘Ljung’ } 

Box-Ljung test 


data: ibm 
X-squared = 7.5666, df = 12, p-value = 0.818 











YVO YY yY s¥ 


> Box.test (lnibm, lag=12, type='Ljung’) 
Box-Ljung test 

data: lnibm 

X-squared = 7.4042, df = 12, p-value = 0.8298 


Simple returns 


0.2 
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实际 上 ， 由 于 m 的 选择 会 影响 QCm) 的 表现 ， 所 以 经 党 选用 多 个 m 值 . 模拟 人 研究 表明 
mIn( 了 T) 会 有 较 好 的 功效 .在 分 析 季 市 性 时 间 序 列 时 ， 由 于 时 间隔 为 周期 的 倍数 的 目 相 关 
系数 更 加 重要 ， 所 以 这 个 一 般 性 的 规则 需要 加 以 修正 . 

例 2.1( 续 ) 对 例 2.1 中 CRSP 组 合 的 最 低 10 分 位 的 资产 组 合 的 月 人 简单 收益 率 ， 
Ljung-Box 统计 量 表明 Q2) =41.06, MEAN p EXW 4.79X 10°; QC24)=56. 25, Xf 
应 的 pp 值 为 2.12X10“. 这 些 p 值 都 很 小 ， 所 以 在 5% 显 著 性 水 平 下 ， 序 列 不 存在 自 相 
关 这 一 原 假设 被 拒绝 . 所以， 最 低 10 分 位 资产 组 合 的 月 简单 收益 率 存 在 序列 目 相 关 人 性 . 

E 

设 x, 为 金融 资产 的 收益 率 序 列 . 在 金融 文献 中 ， 资 本 资产 定价 模型 (Capital Asset 
Pricing Model，CAPM) 理 论 的 一 种 形式 就 假定 序列 (x,) 是 不 可 预测 的 ， 且 没有 上 自 相关 性 . 
日 相关 系数 是 否 为 0 的 检验 用 来 作为 有 效 市 场 假定 是 否 成 立 的 判定 工具 . 然而 ， 股 价 的 
决定 方式 和 指数 收益 率 的 计算 方式 可 能 会 导致 在 观测 到 的 收益 率 序 列 中 有 自 相 关 性 . 这 
在 分 析 高 频 金 融 数 据 时 尤其 常见 .在 第 6 章 中 我 们 将 讨论 这 方面 的 问题 ， 例 如 买 - 卖 价格 
的 跳跃 与 非 同 步 交 易 . 


2.3” 白 曲 再 和 线性 时 间 序 列 

















日 噪声 

如 果 时 间 序 列 x, 是 一 个 具有 有 限 均 值 和 有 限 方差 的 独立 同 分 布 随 机 变量 序列 ， 则 (x,) 
称 为 一 个 和 白 品 声 序列 (white noise). Fp aS. A x, 还 服从 均值 为 0、 方 差 为 o 的 正 态 分 
布 ， 则 称 这 个 序列 为 高 斯 白 曝 声 (Gaussian white noise). XT ARAJ YJ, Pra BAK eK 
BOYS. TES WEA. UR ra AS A A PR Be PW Ay Ke) EIRP 
Sl. 基于 图 2-7 和 图 2-6b, IBM ASR) AW ae Kk A RY. ee AR 10 分 位 资产 组 合 
的 收益 率 不 是 日 噪声 . 

下 面 我 们 讨论 一 些 简 单 的 统计 模型 ， 它 们 对 时 间 序 列 的 动态 结构 建 模 非 常 有 用 ， 而 且 
这 里 所 述 的 概念 在 后 面 资 产 收益 率 的 波动 率 建 模 中 也 是 很 有 用 的 . 

线性 时 间 序 列 

时 间 序 列 z, 称 为 线性 序列 ， 如 采 它 能 写成 


zi = pt 》 pan (2-4) 

FOP ur, WI, go = 1. (a, 是 零 均 值 独立 同 分 布 并 且 有 合理 定义 的 分 布 的 随机 变量 

FA CHB a Æ AREI. 我 们 在 以 后 可 以 看 出 ，w 表示 时 间 序 列 在 t 时 刻 出 现 的 新 

An. KAES a, 称 为 时 刻 1 的 新 息 (innovation) 或 扰动 (Shock)， 本 书 中 我 们 主要 关心 a 

为 连续 型 随机 变量 的 情形 . 并 不 是 所 有 人 金融 时 间 序 列 都 是 线性 的 ， 但 是 实际 应 用 中 线性 模 
型 通常 可 以 提供 精确 的 近似 . 

在 式 (2-4) 定 义 的 线性 时 间 序 列 中 ， 系 数 PRET oe, 的 动态 结构 ， 在 时 间 序 列 文献 中 

这 些 系 数 称 为 x, 的 y 权重 (y-weight). £ r 是 异 平 稳 的 ， 我 们 利用 4a) 的 性 质 可 以 很 容易 
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地 得 到 oc, 的 均值 和 方差 
ECx) =p, Vara) =X (2-5) 


HP o 是 w 的 方差 . AN Varl) <o, MAp BREA, B im colt yi 一 0. 
因此 ， 对 于 一 个 平稳 序列 ， 随 春 i WARE aA a 的 影响 会 逐渐 消失 . 
x, 的 间隔 为 2 的 目 协 方差 为 


E| ( ia.) ( oo | 


= > Di+pjE Caz; ) 


7 二 > iit (2-6) 
Atk, 权重 与 x, 的 目 相 关系 数 有 如 下 关系 : 
X pig 
0/ > 0 (2-7) 
© 1+ yg 





其 中 yj 二 1， 线 性 时 间 序 列 模型 就 是 用 来 描述 的 权重 的 计量 模型 和 统计 模型 ， 对 弱 平 稳 时 
间 序 列 而 言 ， 当 col >0， 从 而 随 着 《的 增加 收敛 到 0。 对 于 资产 收益 率 而 言 ， 这 意味 
着 ， 如 所 期 望 的 那样 ， 当 2 较 大 时 ， 当 前 收益 率 x, 对 遥远 的 过 去 收益 率 过 的 线性 相依 会 消失 . 


2.4 简单 和 目 回归 模型 


当 zx, 具有 统计 显著 的 间隔 为 LI ATER AY. Bate x,_1 可 能 会 在 预测 zx, 时 有 用 . 

下 面 的 简单 模型 可 以 利用 这 样 的 预测 功用 : 
x= i +4, (2-8) 

其 中 ta EEN 0. TÆN o 的 白 品 声 序 列 . 这 个 模型 与 众所周知 的 简单 线性 回归 模型 
有 相同 的 形式 ， 这 里 x, 是 因 变 量 ，z-: 是 解释 变量 . 在 时 间 序 列 文献 中 ， 模 型 ( 式 (2-8)) 称 
为 一 阶 自 回归 (AR) 模 型 ， 或 简称 AR(1) 模 型 .该 模型 也 广泛 地 应 用 在 随机 波动 率 的 建 模 
中 ， 只 不 过 x, 由 它 的 对 数 波动 率 所 代替 ( 见 第 4 间 ). 

式 (2-8) 中 的 AR(1) 模 型 有 奋 干 类 似 于 人 简单 线性 回归 模型 的 性 质 ， 但是， 这 两 个 模型 
之 间 存 在 一 些 显著 的 差异 ， 这 一 点 将 在 以 后 讨论 . 这 里 我 们 注意 这 样 一 个 事实 就 够 了 : 在 
已 知 过 去 收益 率 z :的 条 件 下 ， 由 AR(1) 模 型 可 推 得 : 

Elx, |z) = 二 Tr VarCz |x) = Var(a,)=o 

也 就 是 说 ， 给 定 过 去 收益 率 co A a K A b toa NPOP, 标准 差 是 o. 
给 定 x,-1 条 件 下 ， 收 益 率 zx 与 x,-; 无 关 ， 其 中 i1 汪 1， 这 是 AR(1) 的 马尔 科 夫 性 . BR, H 
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些 情况 下 x,_1 不 能 单独 决定 xz, 的 条 件 期 望 ， 所 以 需要 更 灵活 一 些 的 模型 . AR(1) 模 型 的 直 
接 推 广 是 AR(p) 模 型 : 
XL, 一 Po + $i £ alr aes J a; (2-9) 

其 中 p ESET BRM. (a 的 定义 与 式 (2-8) 中 一 样 ， 这 个 模型 说 的 是 给 定 过 去 数据 ， 过 去 的 
PP 个 值 x,_;(i 王 1,，…，p) 联 合 决 定 r 的 条 件 期 望 ， AR(zp) 模 型 与 以 p Tit BAA HE 
变量 的 多 元 线性 回归 有 相同 形式 . 
2.4.1 AR 模型 的 性 质 

为 了 有 次 地 利用 AR 模型 ， 有 必要 对 它 的 基本 性 质 进 行 研 究 . 我 们 详细 地 讨论 ARC) Al 
AR(2) 柑 型 的 性 质 ， 对 一 般 的 AR(p) 檬 型 只 给 出 结果 . 

AR(1) 模 型 

我 们 首先 讨论 式 (2-8) 定 义 的 AR(1) 模 型 弱 平稳 性 的 充分 必要 条 件 . 假定 序列 是 弱 平 
稳 的 ， 则 ECx) Su, Varl) =y, Covlr,, zt) 57, HP u My EEM y 是 7 HR 
数 而 与 t TK. 我 们 容易 得 到 序列 的 均值 、 方 差 和 目 相 关系 数 . 对 式 (2-8) 两 边 取 期 望 ， 
Wy Ela) =0, Pry 











hes = Po +A Elx) 
EFEKT, Er) = EC, Dae Am 
Po 


/一 各 十 页 人 或 a) S a 


这 个 结果 对 x, 有 两 个 含义 : B, BAA], Wa 的 均值 存在 ; BH. r 的 均值 为 0 当 且 仅 当 
风 二 0， 因 此， 对 平稳 AR DWH, BAS 与 x, 的 均值 有 关 ， 由 三 0 意味 着 E(x,)=0. 
REJAH =g) MAWE AR(CIL) 模 型 写成 如 下 形式 
XL, = PB cS poles a, (2-10) 
重复 代入 ， 由 上 述 方程 可 推 得 
X,—p=a thar + Pap, te 


= >) s 
WRI WG =o. ERWE AR(C1) 模 型 表达 为 式 (2-4) 的 形式 . KIE, x,u Æ a HY 2 VE PA 
数 ， 其 中 io. AAI PSEA a) YE. RIJA ELC, — Wari J=0. 根据 平稳 性 的 
假定 ， 我 们 有 Cov6z,-1, a SEL C- =a, ] 50. AA ni 发生 在 上 时 刻 之 前 ， 而 a, 作 
为 1 时 刻 的 扰动 ， 它 不 依赖 于 任何 过 去 的 信息 ， 所 以 上 面 等 式 的 后 一 个 结 采 可 以 从 这 些 事 
实 得 出 来 . 对 式 (2-10) 两 边 平 方 ， 然 后 取 期 望 ， 得 到 

Varz) = Varr) +a 

EPE of 是 a, 的 方差 .这 里 我 们 用 到 “zx,_1 与 a 的 协 方差 为 0” 这 样 一 个 事实 .而 在 平稳 性 的 
假定 下 ，Var(zx,) 二 Var(x,_1)， 因 此 














(2-11) 








2 


Var(z;) = F 


在 内 二 1 时 成 立 . 各 二 1 的 要 求 源 于 随机 变量 方差 的 非 负 性 和 zx, WI PAE 因此， 由 
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AR(1) 模 型 的 弱 平稳 性 可 推出 一 1 过 加 过 1， 即 | 加 | 三 1. 反之, 若 | 加 | 二 1， 由 式 (2-11) 和 
序列 (a,} 的 独立 性 ， 可 以 证 明 x, 的 均值 和 方差 是 有 限 的 并 且 不 随时 间 变 化 ， 参 见 式 (2-5). 
另外， 由 式 (2-6)，Zx, 的 自 协 方差 也 是 有 限 的 . 所 以 ，AR(1) 模 型 是 弱 平稳 的 . 综 上 所 述 ， 
式 (2-8) 定 义 的 AR(1) 模 型 是 弱 平稳 的 充分 必要 条 件 是 | | 二 1. 
应 用 贞 三 (1 一 册 )w， 可 以 把 AR(1) 模 型 重新 写 为 : 
a= (1— bu than +a, 
在 金融 文献 中 ， 这 个 模型 常用 办 来 刻画 AR(1) 时 间 序 列 的 动态 相依 性 的 持续 性 . 
AR(1) 模 型 的 日 相关 隔 数 
在 式 (2-10) 两 端 乘 以 ww， 再 取 期 望 ， 利 用 a 与 x,-1 的 独立 性 ， 我 们 有 
Elan mm] = BE —-—w)]+ Ea) ) = a; 
EHF ó 是 a 的 方差 . 对 式 (2-10) 两 端 同 乘 以 (x,-, 一 x)， 取 期 望 ， 再 利用 上 述 结 果 ， 我 们 有 
hy +o, €=0 
PLY (O 
RRNA y=y Ea. K, XA O-8) EXW Fi AR(1) 模 型 ， 我 们 有 


2 
Variz,) = = E eyy L> 
1 


由 后 一 个 方程 ，z, AY AHX eR ae CACE) W E 

Pe 一 $i p (=a 
因为 pp 二 1]， 所 以 有 pi 二 加 .这 个 性 质 表明 弱 平 稳 ARC) Fe SEY AHR RRMA oo 二 1 开始 以 
比率 为 办 的 指数 速度 衰减 ， 对 正 的 加 ，AR(1) 模 型 的 自 相关 函数 (ACF) 图 像 呈 现 漂亮 的 指 
BUSI. WRN 6, ARC) BRAY ACF 由 上 下 两 个 都 以 of 比率 衰减 的 图 像 组 成 ， 图 2-8 
显示 ， 当 内 二 0.8 fil ¢,=—0. 8 时 的 ARC) iA ACF 图 . 
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图 2-8 ARC) EAI AY A 4H 2 PK ži 
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AR(2) 模 型 
AR(2) 模 型 为 
XL, = Po FH Bi + Pe Xi» +a; (2-12) 
利用 与 AR(1) 模 型 相同 的 方法 ， 我 们 得 到 : RE p tel, MA 
i po 
es 1— $¢, — 4%, 


利用 $5 =1—- pu FAG AR(2) 改 写成 
Lı = $i Ct — pw) + $: Ct — pw) +a, 
E ERM mR zu RITA 
Qa e = a a as S as 
Xf} _E str ee, HAH 20 时 EL Cz 一 yy)aij 二 0 这 个 性 质 ， 我 们 得 到 
ye 0 
这 个 结果 称 为 平稳 AR(2) 模 型 的 矩 方 程 (moment equation)， 在 上 式 两 端 同 除 以 mm ， 得 到 
x, 的 ACF 的 性 质 . 














or = Fiori Fom €>0 (253) 
Ae a de. Tal BA 1 的 ACF 满足 
0 = P po + $2 0-1 = + $201 
因此 ， 对 平稳 的 AR(2) 序 列 x,， 我们 有 o 三 1， 
rs pı 
O 1=¢, 
C= $i om ai Po or ie 2 
式 (2-13) 的 结果 说 的 是 : 平稳 AR(2) 序 列 的 ACF 满足 二 阶 差分 方程 
(ph a Ba 0, 0 
其 中 B 是 延迟 算 子 (backshift) (或 滞后 算 子 ) BI Bo =p. 这 个 差分 方程 决定 了 平稳 AR 
(2) 序 列 的 ACE FEI. thie Tx, 的 预测 行为 ， 在 时 间 序 列 的 文献 中 ， 有 时 也 用 工 而 不 是 
B 来 表示 延迟 算 子 . 可 以 用 工 表 示 滞 后 (lag) 算 子 ， 例如 Lz 二 zi， Ly 二 i. 
与 上 面 的 差分 方程 相对 应 的 是 二 次 多 项 式 方程 














ji 一 由 之 一 加 之 = 0 (2-14) 
这 个 方程 的 解 是 
__ ht VETTE 
一 29, 


在 时 间 序 列 文献 中 ， 称 这 两 个 解 的 倒数 为 AR(2) 模 型 的 特征 根 (characteristic root). 用 a: 
和 ws 表示 这 两 个 特征 根 . 如 果 两 个 w; 都 是 实 值 的 ， 则 模型 的 二 阶 差分 方程 能 分 解 为 (1 一 
mB)(1 一 wzB)， 这 时 AR(2) 模 型 可 以 看 成 是 一 个 AR(1) 模 型 在 为 一 个 AR(1) 模 型 上 的 运 
算 . 因此 ， 这 时 x, 的 ACF 是 两 个 指数 衰减 的 混合 然而， 如 果 几 十 48; 二 0， 则 w， 和 w 
ERAR A SH He Ht (complex conjugate pair))， 这 时 x, 的 ACF 图 形 将 呈现 出 减 幅 的 
正弦 和 余 强 波 图 像 ， 在 商业 和 经 济 的 应 用 中 ， 复 特征 根 是 很 重要 的 ， 它 们 可 以 刻画 商业 周 
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期 的 行为 ， 对 经 济 时 间 序 列 模型 来 说 ， 复 特征 根 是 第 见 的 ， YP 2-12) E MOAN a — OY SE 
辆 复 特 征 根 的 AR(2) 模 型 ， 随 机 周期 的 平均 (Caverage) 长 度 为 
2 21 
cos [$1/(2 /—*&) ] 
其 中 反 余 弦 函 数 的 值 是 以 弧度 来 表示 的 ， 如果 我 们 将 复数 解 写 成 < 士 贞 的 形式 ， 其 中 i= yl, 
则 我 们 有 办 二 24a， 多 二 一 (a 十 6 )， 并 量 
21 
cos (al «Ja? p) 
其 中 Va +b fe abi 的 模 . 参见 例 2.3 的 详细 说 明 . 

图 2-9 显示 的 是 4 个 平稳 AR(2) 模 型 的 ACF. 图 2-9b  AR(2) BiH C1 —0.6B+ 
0.4B2)z = 一 ww 的 ACF. KHA $ +4 = 0. 36+4X (0. 4) =—1.24<0, XA AR(C2) 模 型 包 
含 两 个 复 特征 根 ， 所 以 它 的 ACF 呈现 出 减 幅 的 正弦 和 余弦 波状 其 他 3 个 AR(2) 模 型 都 
是 有 实 特征 根 的 ， 它 们 的 ACF 呈 指 数 衰减 . 
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图 2-9 AR(2) EAI AY FASE pK A 


612.3 作为 说 明 ， 考 虑 美国 的 实际 国民 生产 总 值 (Gross National Product, GNP) Æ 

节 调 整 后 的 季度 增长 率 ， 时 间 是 从 1947 年 第 二 季度 到 2010 年 第 一 季度 ， 总 计 252 个 观测 

fe. 图 2-10 给 出 了 该 GNP 序列 的 对 数 序列 (单位 :10 亿美 元 ) 和 增长 率 的 时 序 图 .其 中 

图 2-10b 的 增长 率 时 序 图 中 增加 了 一 条 对 应 0 值 的 水 平 线 . 图 中 清晰 地 表明 大 部 分 的 增长 

率 为 正 值 ， 最 大 的 GNP 下 跌 出 现在 2008 年 衰退 期 ， 基 于 下 一 节 中 要 讲述 的 建 模 过 程 ， 这 
里 我 们 对 该 序列 应 用 一 个 ARGA, 拟 合 的 模型 是 : 

(1 —0.438B—0.206B’: 二 0.156Bi)(zx,—0.016)=a, 6G, =9.55X10° (2-15) 
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b 增长 率 序 列 . 数据 经 过 了 季节 调整 ， 其 单位 为 10 亿 美元 


图 2-10 从 1947 年 第 一 季度 到 2010 年 第 一 季度 的 关 国 GNP 序列 时 序 图 


模型 的 标准 误差 分 别 为 0.062、0.067、0.063 和 0. 001. 详细 内 容 可 以 参见 所 附 的 R 输出 
结果 . 模型 ( 式 (2-15)) 给 出 了 一 个 3 阶 多 项 式 方程 ， 即 

1 — 0. 438z — 0. 206z? + 0. 156z* = 0 
该 方程 有 3 个 解 ， 即 1. 616+0. 864i, 1.616—0. 864i 和 一 1. 909. 其 中 的 实 根 对 应 于 一 个 因 
子 L1 一 (1/ 一 1. 909)z]=(1 +0. 524z)， 该 因子 表明 了 该 GNP 增长 率 的 指数 襄 减 特性 ， 对 
+ thee xt 1.616 士 0.864i， 我 们 得 到 其 模 为 V1. 616 +0. 8647 =1. 833, WR 


21 
k = 2 12. 80 
cos (1. 616/1. 833) 


因此 ， 这 个 拟 合 的 AR(3) 模 型 确证 了 美国 经 济 中 存在 随机 周期 ， 该 周期 的 平均 长 度 大 约 为 12.8 
个 季度 ， 这 大 约 为 3 年 该 结 采 是 合理 的 ， 因 为 美国 经 济 会 经 历 膨胀 期 和 紧缩 期 一般 相 信 脱 
胀 期 的 长 度 为 3 年 ， 硅 我 们 用 一 个 非 线 性 模型 把 美国 经 济 分 解 成 “膨胀 期 ?和 “紧缩 期 的话， 数 
据 将 表明 紧缩 期 平均 持续 大 约 3 个 季度 ， 而 膨胀 期 的 平均 持续 期 为 3 年 例如， 可 以 参见 Tsay 
(2010， 第 4 章 )， 平 均 持 续 期 12. 8 个 季度 是 这 两 个 平均 持续 期 的 折 中 .， 这 里 得 到 的 周期 性 在 国 
民 经 济 增长 率 的 研究 中 是 常见 的 ， 例 如 类 似 上 面 所 述 的 现象 在 经 济 合 作 与 发 展 组 织 (Organization 
for Economic Cooperation and Development，OECD， 人 简称 为 经 合 组 织 ) 国 家 也 是 存在 的 . 


da=read.table("q-gnp4710.txt",header=T} 
head (da) 

Year Mon Day VALUE 

1 1947 1 1 238.1 











V 


V 


6 1948 4 t 268.7 
> G=daSVALUE 

> LG=log(G) 

> gnp=diff (LG) 

> dim(da) 

[i] 253 4 
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> tdx=c(1:253) /4+1947 # create the time index 

> par(mfcol=c(2,1)) 

> plot (tdx,LG,xlab=’year’,ylab=’GNP’,type='1") 

> plot (tdx[2:253],gnp,type='1',xlab=‘year’, ylab='growth’ } 
> acf (gnp, lag=12) 

> pacf(gnp,lag=12) # compute PACF 

> ml=arima(gnp, order=c(3,0,0)) 

> ml 


Call: 
arima(x = gnp, order = c(3, 0, 0)) 


Coefficients: 
arl ar2 ar3 intercept 
0.4386 0.2063 -0.1559 0.0163 
s.e. 0.0620 0.0666 0.0626 0.0012 


Sigma*2 estimated as 9.549e-05:log likelihood=808.6,aic=-1607.1 
> tsdiag(ml,gof=12) # model checking discussed later 

> pl=c(1,-ml$coef[1:3]) # set-up the polynomial 

> rl=polyroot (pl) # solve the polynomial equation 

> rl 

[1] 1.616116+0.8642121 -1.909216-0.0000001 1.616116-0.8642121 
> Modirl) 

[1] 1.832674 1.909216 1.832674 # compute absolute values 

> k=2*pi/acos(1.616116/1.832674) # compute length of the period 
> k 

[1] 12.79523 


AR(2) At [a] Ae 9) BY OF fa HE ROE EE BY PY SE A 8 aD 1, A. E 
的 两 个 特征 根 的 檬 小 于 1. 因此， 特征 方程 两 个 解 的 模 要 大 于 1. 在 这 种 条 件 下 ， 
式 (2-13) 中 的 递归 式 保 证 模型 的 目 相 关 郴 数 随 间隔 2 的 增加 而 趋 于 0， 这 个 趋 于 0 的 性 
质 是 一 个 时 间 序 列 平稳 的 必要 条 件 . 事实 上 ， 这 个 条 件 也 适用 于 AR(1) 模 型 ， 这 时 特 
征 方程 是 1 一 轴 z 一 0. 它 的 特征 根 为 w 二 1/z 王 加， 要 使 zx, 是 平稳 的 ， 必 须 有 由 的 模 小 
F1. 而 前 面 已 证 明 过 ， 对 平稳 AR(1) 模 型 有 po, 二 加 . 上面 的 条 件 意味 着 ， 当 l 一 时 
有 o0. 

AR (p ) 模 型 

AR(1) 和 AR(2) 模 型 的 结果 可 以 方便 地 推广 到 由 式 (2-9) 定 义 的 AR(Z) 模 型 .对 平稳 
的 AR(p) 序 列 ， 其 均值 为 








Po 
== 


假定 分 母 不 等 于 0. 该 模型 对 应 的 特征 方程 为 
l= = 
如 果 这 个 方程 所 有 解 的 模 都 大 于 1， 则 序列 zx, 是 平稳 的 . 同样， 该 方程 解 的 倒数 为 该 
模型 的 特征 根 (characteristic root)， 因 此 ， 平 稳 性 要 求 所 有 特征 根 的 模 都 小 于 1 对 平稳 
AR(p) 序 列 而 言 ， 其 目 相 关 国 数 满足 下 面 的 差分 方程 
(1—$,B—$,B’—--—$,B’)=0 £>0 


Eln) = 
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平稳 AR) tet AY AI BAB SE ea CC ACF) BR E M E a TE SX. Ae x MTS BE MN 
状 ， 具 体形 状 取 决 于 其 特征 根 的 性 质 . 
2.4.2 实践 中 AR 模型 的 识别 

在 实际 应 用 中 ，AR 时 间 序 列 的 阶 数 p 是 未 知 的 ， 必 须根 据 实 际 数 据 来 决定 . 这 个 问 
题 叫做 AR 模型 的 定 阶 (order determination)， 这 个 问题 在 时 间 序 列 文献 中 已 被 广泛 研究 . 
一 般 有 两 个 确定 p 值 的 方法 : 第 一 种 方法 是 利用 偏 自 相 关 函 数 (Partial AutoCorrelation 
Function，PACF),， 第 二 种 方法 是 用 某 个 信息 准则 肖 数 . 

in A FH JÈ Ki že (PACF) 

平稳 时 间 序 列 的 PACF 是 ACF 的 图 数 ， 它 在 给 AR 模型 定 阶 时 是 一 个 有 用 的 工具 . 一 
个 简单 而 有 效 的 引进 PACF 的 方式 是 依次 考虑 如 下 一 系列 的 AR 模型 : 


Kie 一 po,i T pi, 1 TE 


























Li 一 po,2 an $19 Lit ally 2 ， T ez 
Lie 一 Po, ag Pi, 3 Lt = E oT >; aa T €31 


Li 一 Poi T Pi, a — alp De = ay >, =. ale 让 Tii | Car 











Ap, @ 27 BON, O72 2, NAM. {er} 是 ARGO) RMN REM, 这些 模型 都 是 多 元 
线性 回归 的 形式 ， 可 用 最 小 二 乘法 来 估计 .事实 上 ， 由 于 它们 是 按 阶 的 高 低 排 列 的 ， 所 以 
我 们 可 以 应 用 多 元 线性 回归 分 析 中 偏 下 检验 的 思想 .第 一 个 式 子 中 的 估计 页 ,| 称 为 x, 的 间 
隔 为 1 oA AK BH: BO PAE PH HIS. WH x, 的 间隔 为 2 的 样本 偏 自 相关 
函数 ; 第 三 个 式 子 中 的 估计 $,., 称 为 zx, 的 间隔 为 3 的 样本 偏 自 相 关 函 数 ; 以 此 类 推 . 

从 定义 可 以 看 出 ， 间 隔 为 2 的 样本 偏 自 相 关 函 数 加 ,, 所 表示 的 是 在 AR(1) 模 型 xz, 二 加 十 
Pix Fer Mi ERIA zx-; 对 zx, 的 贡献 ， 加 ,表示 的 是 在 AR(2) 模 型 上 添加 的 x ;对 x, 的 贡 
献 等 ， 因 此 ， 对 一 个 AR(p) 模 型 ， 间 隔 为 p PARE AS id A AB OG eK PACK 不 应 为 零 ， 而 对 所 有 
j> pb» $ DRA. 我 们 利用 这 一 性 质 来 决定 阶 数 p， 对 于 平稳 高 斯 AR(CZ) 模 型 ， 可 以 证 
HE CRE AS m A FESR PRI (PACE) 4 an P HEE : 

。 当 样 本 容量 了 趋 于 无 穷 大 时 ，% ,收敛 于 风 . 

。 对 > p, $ AATF. 

。 对 /> 六 ,有 的 渐 近 方差 为 1/T. 

这 些 结果 表明 AR Cp) Fe Sl EAB (ind A FR PRICE p 步 截 尾 的 . 

作为 例子 ， 考 虑 从 1926 年 1 月 到 2008 年 12 A CRSP 价值 加 权 指 数 的 月 简单 收益 率 . 
表 2-1 给 出 了 这 个 序列 的 样本 自 相 关 函 数 在 前 12 个 间 阳 上 的 值 ，T 二 996， 该 样本 偏 自 相关 
函数 的 渐 近 标准 差 大 约 为 0.032. 从 而 ,在 5% 的 显著 性 水 平 下 ， 对 该 数据 我 们 识别 出 一 个 
AR(3) 模 型 或 AR(9) 模 型 (也 就 是 ，p 二 3 或 9)， 如果 应 用 1% 的 显著 性 水 平 ， 我们 则 识别 
一 个 AR(3) 模 型 . 
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# 2-1 M 1926 1 A Bi 2008 12 A CRSP 价值 加 权 指 数 的 月 简单 收益 率 
的 样本 偏 自 相关 函数 和 信息 准则 AIC 及 BIC 


p 1 2 3 4 5 6 
PACF 0.115 —0. 030 —0. 102 0. 033 0. 062 —0. 050 
AIC 一 5. 838 —5. 837 一 5. 846 一 5. 845 一 5. 847 一 5. 847 
BIC —5. 833 一 5. 827 —5. 831 一 5. 825 一 5. 822 一 5. 818 
p 7 8 9 10 i 12 
PACF 0.031 0. 052 0. 063 0. 005 —0. 005 0.011 
AIC 一 5. 846 一 5. 847 一 5. 849 一 5. 847 一 5. 845 一 5. 843 
BIC 一 5. 812 一 5. 807 一 5. 805 一 5. 798 一 5.791 一 5. 784 


作为 另外 一 个 例子 ， 图 2-11 给 出 了 例 2.3 GNP 增长 率 的 PACF. 图 2-11 
虚线 表示 的 是 大 约 为 两 个 标准 误差 的 上 下 限 士 2/ V252. 该 PACF 图 表明 AR(3) 模 型 适 
该 数据 ， 因 为 在 5% 水 平 上 上， 样本 PACF 在 前 3 个 间隔 点 上 看 起 来 是 显著 的 .间隔 为 9 的 
PACF 也 略微 显著 ， 而 为 了 人 简单， 我 们 这 里 不 考虑 这 个 更 高 阶 的 模型 . 








Series gnp 
© 
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图 2-11 从 1947 年 第 二 季度 到 2010 年 第 一 季度 美国 实际 GNP 季度 增长 率 的 
样本 偏 自 相关 函数 . 虚线 给 出 了 置信 水 平 为 95% 的 置信 区 间 的 近似 





信息 准则 
有 几 种 信息 准则 可 用 来 确定 AR 过 程 的 阶 pe 它们 都 基于 似 然 函数 . 例如 ， 闭 名 的 赤 
池 信 息 准 则 CAkaike Information Criterion，AIC)(Akaike，1973) 的 定义 如 下 : 


AIC = SEn 8 BBO 十 元 (参数 的 个 数 ) (2-16) 


其 中 工 是 样本 容量 ,公式 中 的 “ 似 然 函 数 ” 是 指 极 大 似 然 函 数 售 计 ， 对 融 斯 AR CC) 模型 ， 
AIC 简化 为 
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AIC) = Inca?) + 2 


Apo? Æ o 的 极 大 似 然 佑 计 ，e 是 a 的 方差 ， 工 是 样本 容量 . 式 (2-16) 中 AIC 的 第 一 项 度 
量 AR() 模 型 对 数据 的 拟 合 优 上 度 ， 而 第 二 项 称 为 准则 中 的 罚 函 数 (penalty function， 又 详 为 补 
傍 函 数 )， 因 为 它 用 参数 的 个 数 来 惩罚 候选 的 模型 ， 不 同 的 罚 孔 数 将 导致 不 同 的 信息 准则 . 

另外 一 个 稼 用 的 信息 准则 图 数 为 施 瓦 次 - 贝 叶 斯 信息 准则 (Bayesian Information Criteri- 
on, BIC). 对 高 斯 ARORA, ， 该 准则 为 


BICC) = In€o7) + 





éln(T) 
T 

在 AIC 中 对 每 个 参数 的 惩罚 为 2， 而 在 BIC 中 为 In(T). 因此 ， 和 AIC 相 比 ， 当 样本 容量 
适度 或 较 大 时 ，BIC 倾 回 于 选择 一 个 低 阶 的 AR 模型 . 

选择 准则 

在 实际 应 用 中 ， 为 了 利用 AIC 来 选择 一 个 AR 模型 ， 要 计算 AICY)， 其 中 Ll 二 0，1，2,…， 
P, 为 事先 给 定 的 一 个 正 整数 ， 然 后 选择 阶 &， 使 AIC 达到 最 小 值 . 该 过 程 同样 适用 于 BIC. 

K 2-1 也 给 出 了 pz=1，2，…，10 时 AIC 和 BIC 的 值 . 这 些 AIC 值 都 很 接近 ， 当 p= 二 9 时 
达到 最 小 值 一 5.849， 故 按 AIC 准则 g 
应 选 AR(9) 模 型 ， 而 对 BIC Kit. M 
p=1 if, Ke) — 5. 833, 
p=3 时 达到 很 接近 最 小 值 的 第 二 小 的 
值 一 5. 831， 因 此 BIC 为 加 权 指 数 收益 
率 选 择 一 个 AR(1) 模 型 . 这 个 例子 说 
明 不 同 的 方法 或 者 准则 可 能 会 得 出 p 
的 不 同 选择 ， 在 实际 应 用 中 , 还 没有 “ 
证 据 表 明 一 种 方法 就 一 定 比 为 外 一 种 
方法 好 .对 给 定 的 时 间 友 列 选择 一 个 ” 
AR 模型 时 ， 还 有 两 种 因素 起 着 重要 Order 
作用 ， 就 是 所 研究 问题 的 具体 信息 和 ” 图 2-12 从 1947 年 第 二 季度 到 1991 年 第 一 季度 美国 实际 
ERA H fr UE. GNP 季度 增长 率 的 AIC 值 ， 最 大 阶 数 为 P= 12 

再 次 考虑 例 2. 3 中 美国 季度 实际 GNP 增长 率 序列 ， 图 2-12 中 给 出 了 P=12 的 AIC 
fi. AIC 信息 准则 为 序列 识别 了 一 个 AR(9) 模 型 ， 但 是 它 也 说 明了 AR(3) 模 型 也 有 合理 
性 ， 图 2-12 表明 ， 如 果 着 重 于 较 低 阶 的 模型 ，AIC 将 会 识别 一 个 AR(3) 模 型 注意, 在 RR 
中 的 ar 命令 已 经 对 AIC 准则 值 进行 了 调整 ， 使 得 AIC 的 最 小 值 为 0. 

> mml=ar(gnp,method='mle’) 

> mmlsorder % Find the identified order 


[1] 9 
> names (mmi) 
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AIC 
4( 











0 2 4 








[1] "order" "ar" "Var .pred" "x mean" "aic" 
[6] "n.used" "order.max" "partialacf" "resid" "method' 
[11] "series" "frequency" "call" "“asy.var.coef" 


> print (mmlSaic,digits=3) 
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0 1 2 3 4 5 6 T 8 9 

7748 11.92 8.79 4.669 6.265 5.950 5.101 4.596 6.541 0.00C 
10 EL 12 
0.509 2.504 2.057 


> alc=mmlSaic % For plotting below. 

> length(aic) 

[1] 13 

> plot(c(0:12),aic,type=’h‘’,xlab=' order’ ,ylab=‘aic') 

> lines(0:12,aic, lty=2) 

参数 估计 

对 于 由 式 (2-9) 给 出 的 一 个 具体 的 AR(ZD) 模 型 ， 我 们 稼 用 条 件 最 小 二 乘法 来 估计 其 参 
数 ， 条 件 最 小 二 乘法 是 从 第 p 十 1 个 观测 值 开始 的 . 具体 地 说 ， 在 给 定 前 p 个 观测 值 的 前 
提 下 ， 我 们 有 











i Diy Te Py pa lt t= poles l 
ERAS TAREE. HBB Aiea Hit. ig Ao 的 估计 ， 拟 合 的 
模型 (fitted model) 为 





car 一 $, a 由 Ti B Pa 1 Er. 
对 应 的 残 差 为 
= 


PRG, 为 残 差 序列 (residual series)， 并 得 到 








如 果 用 条 件 高 斯 最 大 似 然 方法 ，# 的 估计 保持 不 变 ， 而 of WEHEN =a! x (T 一 2p 一 1)/ 
(T 一 p)， 在 一 些 统计 软件 包 中 ，72 的 定义 为 各 X(T 一 2p 一 1)/T， 作 为 说 明 ， 考 虑 对 表 2-1 
所 示 的 价值 加 权 指 数 的 月 简单 收益 率 建立 一 个 AR(3) 模 型 ， 拟 合 的 模型 为 
,0.0091==0:110 5 二 00.019% yp — 0.1013 ae 0 = 02054 

模型 系数 的 标准 误差 依次 分 别 是 0. 002, 0.032, 0.032 和 0.032， 除 了 间隔 为 2 的 系数 外 ， 
其 他 系数 在 1% 的 水 平 下 都 是 显著 的 . 

对 这 个 例子 ， 拟 合 模型 的 AR 系数 都 很 小 ， 表 明 所 考虑 序列 的 前 后 相关 性 较 弱 ， 即 使 
这 种 相关 性 在 1% 水 平 下 是 统计 显著 的 ， 拟 合 的 模型 中 名 的 显著 性 意味 着 这 个 序列 的 期 户 
平均 收益 率 是 正 的 ， SESE, @=0.0091/(1—0. 116+0.019+0. 104) =0. 009， 是 一 个 很 
小 的 数 ， 但 它 有 重要 的 长 期 意义 ， 这 意味 着 该 指数 的 长 期 收益 率 是 相当 大 的 ， 利 用 第 1 章 
中 定义 的 多 期 简单 收益 率 ， 这 时 平均 年 度 简单 毛 收益 率 是 | J +a | ”一 1~0. 093, 
换 句 话说 ，1926 一 2008 年 ，CRSP 价值 加 权 指 数 的 月 简单 收益 大 约 平均 每 年 增长 9.3%， 
这 支持 这 样 一 个 通常 的 观点 ， 从 长 期 来 看 ， 股 票 市 场 的 表现 令 人 乐观 ，1926 年 年 初 1 美元 
的 投资 ， 到 2008 年 年 底 的 价值 大 约 为 1593 美元 . 


> vw=read.table(’m-ibm3dx.txt’,header=T) [ ,3- 
> tl=prod (vw+1) 

















65 | 


= Z 2# 





> 七 1 

[L1] 1592.953 

> t1^(127/996)-1 
[1] 0.0929 


模型 的 检验 

我 们 必须 仔细 地 检查 拟 合 的 模型 以 防止 可 能 存在 的 模型 的 非 充分 性 .如果 模型 是 充分 的 ， 
则 其 残 差 序列 应 是 白 噪声 . 残 差 的 样本 自 相 关 函 数 和 式 (2-3) 定 义 的 Ljung-Box 统计 量 可 用 来 
检验 a 与 日 噪声 的 接近 程度 .对 ARORA, Ljung-Box 统计 量 QOM Hpi ARM A HEN im — 
g 的 X 分 布 , 其 中 & 是 所 用 模型 中 AR 系数 的 个 数 . 这 里 对 自由 度 进 行 了 修正 ， 因 为 从 拟 合 
AR(0) 模 型 到 拟 合 AR(p) 模 型 ， 对 残 差 4 的 限制 个 数 增 加 了 .， 如果 发 现 拟 合 的 模型 是 不 充分 
的 ， 那 么 就 需要 对 它 进 行 改 进 ， 例如， 如 果 估 计 的 AR 系数 中 有 一 些 与 0 没有 显著 差别 ， 则 
我 们 应 该 去 掉 这 些 不 显著 的 参数 对 模型 进行 简化 ， 如果 残 差 的 ACE 显示 出 额外 的 序列 相关 
性 ， 则 应 考虑 到 这 些 相 关 性 而 对 模型 进行 扩展 . 
注 记 : 大 多 数 的 时 间 序 列 软 件 包 在 对 残 差 序列 应 用 Ljung-Box 统计 量 Q(m) 时 不 对 自由 度 
TRAE. 这 与 理论 不 相符 合 ， 但 是 当 m 达 g 时 是 可 以 理解 的 . 在 R 中 ， 在 应 用 命令 arima 
7 模型 拟 合 后 ， 可 以 应 用 命令 tsdiag 来 进行 诊断 检验 ， 具 体 细节 后 面 将 进行 讨论 。 m 
现在 考虑 对 价值 加 权 指 数 的 月 简单 收益 率 拟 合 AR(3) 模 型 所 得 的 残 差 序列 .可 算得 
Q(12)=16.35， 并 且 基 于 它 所 渐进 服从 的 自由 度 为 9 的 xX 分 布 ， 得 到 的 户 值 为 0.060. 这 
样 ， 在 5% 的 水 平 下 ， 前 12 个 间隔 无 前 后 相关 性 的 原 假 设 几 乎 不 能 拒绝 . 然而 ， 间 隔 为 2 
的 AR 系数 在 5% 的 水 平 下 是 不 显著 的 ， 我 们 可 以 将 模型 改进 为 : 

x, = 0. 0088 +0.1142,; —0.106z,-3 , G = 0.0536 

现在 所 有 的 估计 在 1% A KOE PB AB SY. RPE RSH Q(12) = 16.83, Æ p 值 为 
0. 078( 基 于 Lio FP Ai). 该 模型 对 数据 的 动态 线性 相依 性 的 建 模 是 充分 的 . 


> vw=read.table('m-ibm3dx2608.txt’,header=T) [,3. 
> m3=arimalvw,order=c(3,0,0)) 

> m3 

Call: 

arima(x = vw, order = c(3, 0, 0)) 











it 4 
it 4 








Coefficients: 
arl ar2 ar3 intercept 
0.1158 -0.0187 -0.1042 0.0089 
s.e. 0.0315 0.0317 0.0317 0.0017 


sigma*2 estimated as 0.002875:log likelihood=1500.86, aic=-2991.7 


> (1-.1158+.0187+.1042)*mean(vw) % Compute the intercept phi(Q). 
[1] 0.00896761 

> sqrt (m3$sigma2) $ Compute standard error of residuals 

[1] 0.0536189 


> Box.test (m3$residuals, lag=12, type=‘Ljung’ ) 
Box-Ljung test 


data: m3Sresiduals $ R uses 12 degrees of freedom 
X-squared = 16.3525, df = 12, p-value = 0.1756 
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> pv=l1-pchisq(16.35,9) % Compute p value using 9 degrees of freedom 
> pv 

[1] 0.05992276 

% To fix the AR(2) coefficient to zero: 

> m3=arima(vw, order=c(3,0,0),fixed=c(NA,0,NA,NA) ) 

% The subcommand "fixed" enables users to fix parameter values, 

% where NA means estimation and 0 means fixing the parameter to 0. 
% The ordering of the parameters can be found using m3S$coef. 

> m3 
Call: 
arima(x = vw, order = c(3, 0, 0), fixed = c(NA, 0, NA, NA)) 


Coefficients: 
arl ar2 ar3 intercept 
0.1136 0 -0.1063 0.0089 
s.e. 0.0313 0 0.0315 0.0017 


Sigma*2 estimated as 0.002876: log likelihood=1500.69, aic=-2993.38 
> (1-.1136+.1063)*.0089 % compute phi(0) 

[1] 0.00883503 

> sqrt(m3$sigma2) % compute residual standard error 

[1]: 0.05362832 


> Box.test (m3$residuals, lag=12,type=’Ljung’ ) 
Box-Ljung test 
data: m3Sresiduals 


X-squared = 16.8276, df = 12, p-value = 0.1562 


> pv=l-pchisq(16.83,10) 
> pV 
[1] 0.07382113 


2.4.3 WAKE 


衡量 平稳 模型 拟 合 优 度 (goodness of fit) 的 一 个 常用 的 统计 量 是 R* 统计 量 ， 其 定义 为 
js ， ae EH 
总 误 半 平方 种 
对 于 平稳 ARCp) 时 间 序列 模型 ， 假 设 有 了 个 观测 值 {| 一 1，…，T}， 则 R* ZH 
>) ai 
R? Z 1 — > t=p+1 
> (x, — 
t=ptl 


spr =(S)2)/(T—p). ADEN, 0R. FSI, RRK, RRES AEN 


合 的 越 好 .然而 该 结论 只 对 平稳 时 间 序 列 成 立 ， 对 于 本 章 后 面 将 要 讨论 的 单位 根 非 平稳 序 
Si, RRA Be FIC AI» FOYE zx, 实际 服从 一 个 什么 样 的 模型 ， 对 其 拟 合 的 AR(1) 模 
型 的 R 均 趋 于 1. 

众所周知 ， 对 于 一 个 给 定 的 数据 集 ，R 是 所 用 参数 个 数 的 非 降 函 数 . 为 了 克服 该 缺 
Ao SEM Va SEB R (adjusted R*)， 它 的 定义 为 








a 2# 








pee 残 差 的 方差 
Adi(R*)=1C 一 一 
ee xz 的 方差 

iil 


其 中 从 是 xz, 的 样本 方差 ， 这 个 新 的 衡量 方法 将 拟 合 模型 中 用 到 的 参数 个 数 也 考虑 在 内 ， 然 
而 ， 其 取 值 仍然 是 0 一 1 


2.4.4 预测 


预测 是 时 间 序 列 分 析 的 一 个 重要 应 用 . 对 式 (2-9) 中 的 AR(p) 序 列 ， 假定 我 们 在 时 间 
指标 为 hh 的 点 上 ， 欲 预测 z+s，L 宇 I， 时 间 指 标 h 称 为 预测 原点 (forecast origin)， 正 整数 
l 称 为 预测 步 长 (forecast horizon). WE, OW z+ 的 最 小 均 方 误差 预测 ， 我 们 选择 Zz, (DO VF 
为 预测 ， 该 预测 ZC 满足 : 

E{ £r -:G@G== mink | Cr, = day 
其 中 g Æa] h NA AIA NAD Aaa AA ea. We 是 F, PRR. REE OW x, 的 
以 刀 为 预测 原点 的 Z 步 超前 预测 .在 上 面 公式 中 ， 瓦 为 在 预测 原点 天 所 得 到 的 信息 集合 . 
超前 1 步 预测 

由 ARORA, 我们 有 

Za = P | Ant 
在 最 小 平方 误差 损失 函数 下 ， 给 定 Fro Err AD NRE 


p 
T, (1) E Me | FA) | Po ig Sear 

















对 应 的 预测 误差 为 

en ( Di Tee — Ye 
从 而 ， 超 前 1 步 预测 误差 的 方差 为 VarLe, D= Varlan) 50. Ar a 服从 正 态 分 布 ， 则 r H 
95% 的 超前 1 步 区 间 预 测 是 名 (1) 土 1. 96Xz。 对 式 (2.0 给 出 的 线性 模型 ，w ,也 是 以 ; 为 预测 原 
点 的 超前 1 步 预测 误差 ， 在 计量 经 济 学 文献 中 ，w,, 称 为 在 1 十 1 时 刻 对 序列 的 扰动 (shock) 

在 实际 应 用 中 ， 经 常用 被 估 参 数 来 计算 点 预测 和 区 间 预 测 ， 这 样 做 的 结果 是 条 件 预 测 
(conditional forecast) ， 因 为 这 样 的 预测 没有 考虑 参数 估计 中 的 不 确定 性 . 在 理论 上 上， 我们 
可 以 在 预测 中 考虑 参数 的 不 确定 性 ， 但 复杂 性 大 大 增加 .预测 中 考虑 参数 和 模型 不 确定 性 
的 自然 途径 是 马尔 科 夫 链 壹 特 卡 洛 (Markov chain Monte Carlo，MCMC) 方 法 . HAA 
可 以 参见 Tsay(2010) 的 第 12 $. 为 了 人 简单， 本章 假 设 模型 为 已 知 的 . 当 在 估计 中 使 用 的 
样本 容量 充分 大 时 ， 和 条件 预 测 与 无 条 件 预测 是 接近 的 . 

超前 2 步 预测 

下 面 考虑 以 户 为 预测 原点 对 zi; 的 预测 ， 由 AR(p) 模 型 ， 我 们 有 

Li = Po FP ent Het + Ppp F Ante 











取 条 件 期 望 ， 我 们 有 
7 = ECGs | F) = Po 十 内 zx, (1) + $5 Tı apoa Pp Diep 
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对 应 的 预测 误差 为 
(| = Ge a 

预测 误差 的 方差 为 YarLe, 2) I= A+ de or. £r: WY TB PAT WS oc MA RT 
出 来 . 值得 注意 的 是 VarLe, (2) ]2Varle,) ], ROA AM RK N se EN HP AN 
WE PECL I. Xk SRE BIN: 对 线性 序列 来 说 ， 我 们 在 于 时 刻 对 zs 的 把 握 不 如 对 
Xn+1 的 把 握 大 . 

起 前 多 步 预 测 

一 般 地 ， 我 们 有 








Ere 一 Po a $ Lite Sigua i 的 区 ae An+¢ 
基于 最 小 平方 误差 损失 函数 而 得 到 的 超前 2 步 预测 就 是 ， 给 定 APP RB zi 的 条 件 期 











1) 


HHR, 4ixom, AAR, Or. 这 个 预测 可 用 乌 OG=1, ++, ¢-Die EMITS E 
来 ， 超 前 4 步 预测 的 误差 是 600 二 zs, 一 名 (0)， 可 以 证 明 ， 对 平稳 AROFA, Mook, 
各 (0 收敛 于 ECz,)， 也 就 是 说 ， 对 这 样 的 序列 ， 长 期 的 点 预测 趋 于 无 条 件 均值 ， 在 金融 学 广 
献 中 ， 这 种 性 质 称 为 均值 回转 (mean reversion). 对 AR(1) 模 型 均值 回 转 的 速度 由 半衰期 
Chalflife) 来 衡量 ， 其 中 半衰期 定义 为 《二 InC0. 5)/in( | 和 |)， 预 测 误差 的 方差 则 趋 于 的 无 条 
件 方差 ， 注意 ， 对 式 (2-8) 中 的 AR(1) 模 型 ， 设 =, EC) SEP I. AD AE HE 


2 a. 1 
预测 原点 有 的 b RAIN AZ, O=b a,. 也 就 是 ， 本 了 Atk, g=Inco. 5)/Inc| ¢, |). 


表 2-2 包含 了 对 价值 加 权 指 数 月 简单 收益 率 的 超前 1 步 至 12 步 的 预测 结果 以 及 相应 的 
顶 测 误差 的 标准 误差 : 以 984 为 预测 原点 ， 利 用 前 984 个 观测 值 重 新 估计 的 AR(3) 模 型 . 
拟 合 的 模型 为 : 
x, = 0.0098 二 0.1024zxi1 一 0.0201z — 0.1090zx, 3 二 a 




















表 2-2 对 CRSP 价值 加 权 指 数 月 简单 收益 率 用 AR(3) 模 型 的 超前 多 步 预测 的 结果 ， 预 测 原 点 为 984 





步 数 1 2 3 4 5 6 
预测 值 0. 0076 0.0161 0. 0118 0. 0099 0. 0089 0. 0093 
标准 误差 0. 0534 0. 0537 0. 0537 0. 0540 0. 0540 0. 0540 
真实 值 一 0. 0623 一 0.0220 一 0. 0105 0.0511 0. 0238 一 0. 0786 

HE 7 8 9 10 11 12 
预测 值 0. 0095 0. 0097 0. 0096 0. 0096 0. 0096 0. 0096 
标准 误差 0. 0540 0. 0540 0. 0540 0. 0540 0. 0540 0. 0540 
真实 值 一 0. 0132 0. 0110 —0. 0981 —0. 1847 —0. 0852 0. 0215 


注 : 预测 原点 为 984. 


Xo, =0.054. K 2-2 中 也 给 出 了 2008 年 的 实际 收益 率 , 由 于 序列 的 弱 目 相关 性 ， 
预测 值 和 预测 误差 的 标准 差 很 快 收敛 到 数据 的 样本 均值 和 标准 差 . 前 984 个 观测 值 的 样本 
均值 和 标准 差分 别 为 0. 0095 和 0.0540. 

图 2-13 显示 了 价值 加 权 指 数 月 简单 收益 率 的 样本 外 预测 值 . 预测 原点 为 2007 年 12 
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月 ， 相 应 于 1 二 984. 图 2-13 中 包括 预测 值 的 两 个 标准 差 的 上 下 限 和 2008 4 AY SE Pri ii SK. 
在 图 2-13 中 ， 预 测 值 和 真实 值 分 别 用 %o” 和 “。” 来 标记 . 从 图 2-13 中 可 知 ， 除 了 2008 年 
10 月 以 外 ， 所 有 真实 收益 都 位 于 95% 的 预测 区 间 内 . 


0.2 





s-return 
0.1 


0.0 


-0.1 





-0.2 





2007.5 2008.0 2008.5 2009.0 
Time 


图 2-13 CRSP 价值 加 权 指 数 月 对 数 收 益 率 的 超前 1 步 至 12 步 的 预测 图 ， 预 测 原 点 为 :二 984， 预 测 
{EF “o” 表示， 实际 值 用 实 点 ”。 ”表示 . 两 条 虚线 表示 预测 值 的 两 个 标准 误差 的 上 下 限 


2.5 简单 移动 平均 模型 


我 们 来 讨论 MA 模型 ， 它 们 在 金融 收益 率 建 模 中 也 很 有 用 . 如 在 第 6 章 将 要 讨论 的 ， 
股票 交易 中 买卖 价 的 弹跳 会 在 收益 率 序 列 中 引出 一 个 MA(1) 结 构 . 有 几 种 方式 引进 MA 
模型 .一 种 方式 是 把 它 当 做 白 品 声 序列 的 简单 推广 ， 男 一 种 方式 是 把 它 看 成 参数 受 某 种 限 
制 的 无 穷 阶 AR 模型 . 我 们 采用 第 二 种 方式 . 

除了 人 简单 性 之 外 ， 没 有 特别 的 理由 预先 假定 AR 模型 的 阶 是 有 限 的 .至少 在 理论 上 我 
们 可 以 考虑 无 穷 阶 AR 模型 ， 其 形式 为 : 

% =p Fhmn F huaa ea 
然而 ， 这 样 的 AR 模型 是 没有 实际 意义 的 ， 因 为 它 有 无 穷 多 个 参数 . 使 这 样 的 模型 有 实际 
用 途 的 一 个 方式 是 假定 系数 $8 满足 某 种 限制 条 件 ， 使 得 它们 可 由 有 限 个 参数 决定 . 这 种 想 
法 的 一 个 特殊 情形 为 



































We = OO Oi es e (2-17) 
其 中 系数 只 依赖 于 单个 参数 0 ， 对 iSl 满足 加 三 一 01， 要 使 式 (2-17) 中 的 模型 是 平稳 的 ， 
0 的 绝对 值 必 须 小 于 1; 否则 ，01 以 及 序列 本 号 将 发 散 .， 因 为 |9 L<, HA ioh, 
有 01 悦 0， 从 而 x. x, 的 贡献 随 i 的 增加 以 指数 速度 衰减 . 这 一 点 是 合理 的 ， 因 为 平稳 
序列 x, 对 它 的 沛 后 值 x,-; 如 果 有 依赖 的 话 ， 这 种 依赖 程度 应 随时 间 隧 减 . 
式 (2-17) 中 的 模型 能 写成 一 个 比较 么 次 的 形式 . 为 此 ， 我 们 把 模型 重 写成 
t +O 2 +O a2 + = & +a, (2-18) 
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对 x BEAN 
La +O HË $e =H Han (2-19) 
46.0 (2-19) PH FEL 9 ， 然 后 减 去 式 (2-18)， 得 到 
wl =o.) as — 0a 
此 式 说 明 ， 除 了 和 常数 项 外 ，z, 是 两 个 扰动 a, Ma. ;的 加 权 平 均 . 因此 ， 该 模型 称 为 1 阶 
MA 模型 ， 简 称 MA(1) 模 型 ，MA(1) 模 型 的 一 般 形式 为 





wa Ba Hee — Ee: (2-20) 
其 中 co ET RM. (a 是 日 噪声 序列 .类似 地 ，MA(2) 模 型 的 形式 为 
Lı = Co Fa, — Oia, — 2a (2-21) 
MA(g) 模 型 为 
Wh 6. aie (2-22) 





BY z,=co + (1—6,B—---—6,B") a, |, 0 
2.5.1 MA 模型 的 性 质 


我 们 仍然 只 讨论 简单 的 MA(G1D) 和 MA(2) 模 型 ， 一 般 的 MA(gq) 模 型 的 结果 可 用 相同 的 
方法 得 到 . 
平稳 性 
MA RA AESF, AKENE A RAE J AA RREH. HA A N E A pa 
时 间 变 化 的 . 例如， 考虑 式 (2-20) 给 出 的 MA(C1) 模 型 ， 对 这 个 模型 两 端 取 期 望 ， 得 到 
ECx,) = Co 
上 式 中 的 F(z) 不 随时 间 变 化 ， 在 式 (2-20) 两 端 取 方差 ,我们 有 
Var(a,) = of + fio, = G+ Oo; 
这 里 我 们 用 到 a 与 a,_ ;的 不 相关 性 Var Cr, ) 也 是 不 随时 间 变 化 的 . 这 些 讨 论 对 一 般 的 
MA(g) 模 型 也 适用 ， 因 此 我 们 得 到 两 个 一 般 性 质 : 第 一 ，MA 模型 的 常数 项 就 是 序列 的 均 
ECI EC) =c); 第 二 ，MA(g) 模 型 的 方差 为 
Var) = a +A +0 + +H) 








H $H X eK Be 
HPE, BE MAORA P co = 0. RA ARA c RITA 
Tili = Hyp, Un lpi 
取 期 望 ， 得 到 
N= 一 os Hl>lh, »% =0 
利用 上 述 结 果 和 Var(zx,) 二 (十 )o;s ， 我 们 有 





0 
po = 1, PTR œ =Q, f >d 


因此 ， 对 MA(1) 模 型 ， 间 隔 为 1 的 ACF AA 0, 但 所 有 间隔 大 于 1 的 ACF 都 是 0， 换言之， 
MA(1) 檬 型 的 ACF 在 间隔 为 1 Da ea. 对 式 (2-21) 给 出 的 MAC2) 模 型 ， 目 相关 系数 是 





7 | 


54 h 2P 








= — h +h ”一 6 
O IFEF PM  14+E+R’ 

这 里 ， 在 间隔 为 2 URRE. 这 个 性 质 可 推广 到 其 他 MA 模型 . 对 MARA, H ACF 
在 间隔 为 g 时 不 为 0,， (EX >q, o =0. 因此，MA(g) 序 列 只 与 其 前 g 个 滞后 值 线性 相关 ， 
从 而 它 是 一 个 “有 限 记 忆 ” 模 型 . 

ny jd PE 

将 零 均值 MA(1) 模 型 改写 为 a, 二 x 十 0a, 1;， 重 复 代 替 可 以 得 到 

CL = Xi HOt HOt Us + la 

该 等 式 表 明 当 前 的 扰动 w 是 序列 x, 现 在 和 过 去 取 值 的 线性 组 合 ， 从 直观 上 看 ， 随 着 7 的 增加 1 
应 该 趋 于 零 ， 因 为 即使 遥远 的 过 去 收益 率 x,_; 对 当前 的 扰动 有 影响 ， 其 影响 也 微不足道 ， 因 此 ， 
要 使 MA(1) 模 型 看 起 来 是 合理 的 ， 我 们 应 该 要 求 10. | 二 1， 这样 的 MA(1) 模 型 称 为 可 逆 的 .如 
KR | A | 二 1， 则 MA() 模 型 是 不 可 道 的 .对 于 可 道 性 的 进一步 讨论 参见 Tsay (2010， 第 2 章 ). 











2. 5.2 MA 模型 定 阶 


A FAK ek ee ACF 是 识别 一 个 MA 模型 阶 数 的 有 用 工具 . 对 于 具有 上 自 相关 函数 w 的 时 
间 序 列 x A yA, 但 对 LY 二 gq A p50, M x 服从 一 个 MA(q) 模 型 . 

图 2-14 显示 了 CRSP 等 权重 指数 (equal-weighted index) 从 1926 年 1 月 到 2008 年 12 H 
的 月 简单 收益 率 的 时 序 图 和 样本 自 相 关 函 数 图 .在 样本 目 相 关 函 数 图 中 有 两 条 虚线 ， 它 们 
是 两 个 标准 误差 的 上 下 限 . 可 见 ， 该 序列 的 目 相 关系 数 在 间隔 为 1、3、9 时 显著 .在 更 大 
的 间隔 上 也 有 稍微 显著 的 ， 但 我 们 这 里 不 考虑 它们 . 基于 样本 自 相 关 孔 数 ， 我 们 给 该 序列 
建立 下 面 的 MA(9) 模 型 : 


























Li = Co T fa aAa: Ce Oy Aig 
Monthly simple returns: 1926—2008 
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图 2-14 CRSP 等 权重 指数 从 1926 年 1 月 到 2008 年 12 H WH f Bii FY BY ae E AREAS A PK PR CAI 


E ph HF Va] J Z) by R EE R 55 





注意 ， 与 PACF 不 同 ， 样 本 ACF 提供 了 模型 非 零 MA 滞后 项 的 信息 . 

为 了 说 明 这 一 点 ， 例 如， 考虑 一 个 0 =0 的 简单 MA(2) 模 型 ， 模 型 为 二 6 十 a 一 a 
应 用 式 (2-23) 或 者 直接 计算 ,得 到 模型 的 ACF H: 
= -5 并 且 当 7 了 之 2 时 ,有 =l. 
因此 对 于 这 一 特殊 的 例子 ，ACF 给 出 了 模型 结构 的 准确 信息 . 


2.5.3 ”模型 估计 


估计 MA 模型 通常 用 最 大 似 然 法 . 有 两 种 方法 求 MA 模型 的 似 然 函 数 . 第 一 个 方法 是 
假设 初始 的 “扰动 ”( 即 a KORRE O, AE ai SS co az =x: co thas nji HEI 
到 计算 似 然 函 数 所 需要 的 “扰动 "” 这 种 方法 称 为 条 件 似 然 法 (conditional likelihood method) , 
所 得 的 估计 是 条 件 最 大 似 然 估计 .第 三 种 方法 是 把 初始 “扰动 *a,，t 三 0， 当 做 模型 的 附加 
参数 与 其 他 参数 一 起 估计 出 来 ， 这 种 方法 称 为 精确 似 然 法 (exact likelihood method). 精确 
似 然 估计 优 于 条 件 似 然 人 和 估计， 尤其 是 当 MA 模型 接近 于 不 可 逆 时 .， 然而， 精确 似 然 估计 的 
计算 会 更 复杂 一 些 . 如 果 样 本 量 较 大 ， 这 两 种 似 然 佑 计 是 接近 的 . 关于 MA 模型 精确 似 然 
估计 和 条 件 似 然 估计 的 细 市 讨论 ， 可 参阅 Box 等 (1994) 或 Tsay(2010， 第 8 $). 

作为 例子 ， 我 们 来 考虑 CRSP 等 权重 指数 的 月 简单 收益 率 序 列 ， 建 立 一 个 MA C9) Be 
型 ， 用 条 件 最 大 似 然 法 拟 合 的 模型 为 

x, = 0.012c+a+0.188 3 ,91224a, ,， G, = 0.0714 (2-24) 
其 中 系数 估计 的 标准 误差 分 别 为 0.003、0.031、0.031 和 0.031. 残 差 的 Ljung-Box 统计 | | 
量 为 Q(12) 二 17. 5， 基 于 自由 度 为 9 的 Xx 分 布 的 p 18H 0.041. 由 此 可 知 ， 模 型 对 于 数据 LY 
动态 线性 依赖 关系 的 刻画 是 不 充分 的 ， 还 需要 修正 . 如果 应 用 的 自由 度 为 12， 则 pp 值 为 
0. 132. 用 精确 最 大 似 然 法 拟 合 的 模型 为 

x, = 0.012 +a, +0. 191la,_; — 0. 120a, + 0.123a,5, 6, = 0.0714 (2-25) 
其 中 各 估计 的 标准 误差 为 0.003、0.031、0.031 和 0.031. ZÆ Ljung Box 统计 量 为 QU2)= 
17.6， 当 上 自由 度 分 别 为 9 和 12 时 ， 相 应 的 之 值 分 别 为 0.040 和 0. 128， 和 前 面 一 样 ， 拟 合 的 模型 
仅仅 略微 充分 ， 比 较 模 型 ( 式 (2-24)) 和 模型 ( 式 (2-25))， 可 见 ， 对 这 样 一 个 具体 例子 来 说 ， 条 件 
似 然 法 和 精确 似 然 法 的 差别 是 微不足道 的 . 


0o =l, ol 二 0， 


























注 记 : R 用 精确 似 然 法 进行 估计 . 另外 ，MA 的 多 项 式 写 为 1 十 OB 十 … 十 9,B"， 而 不 
是 通常 的 参数 化 方式 1 一 01B 一 … 一 9,B". 特别 地 ，R 的 arima 命令 的 ARMA(p，g) 模 型 
的 形式 为 : 
(= B — = 0.6" ag) = Cl ob a 0B’ i 





HEF, u PHERI intercept). 参见 后 面 所 附 的 R 输出 . 
2.5.4 用 MA 模型 预测 


MA 模型 的 预测 很 容易 实现 . 因为 模型 具有 有 限 记 忆 ， 它 的 点 预测 很 快 变 为 序列 的 均 
值 ， 为 了 说 明 这 一 点 ， 设 预测 原点 为 h， 记 , 为 在 h 时 刻 所 能 得 到 的 信息 集合 ,对 MA(1) 过 





a 2# 





程 的 超前 1 步 预测 ， 由 模型 可 知 
Lay = Co Vir — Oa, 
取 条 件 期 望 ， 我 们 有 
GM) =E Gea F) = = 
ol) = 43 — 4, CD = ais 
超前 1 步 预测 误差 的 方差 为 VarLe' (1)j 二 4. 在 实际 中 ，a, 这 个 量 可 由 多 种 方式 得 到 ， 例 
MALE a =0, WH a=a—-o. MS 25th Hf, a, 可 由 公式 4 二 x 一 co 十 .a,-1 递 推 
得 到 . 另外 ， 还 可 用 MA(1) 模 型 的 AR 表示 来 计算 w (参见 2. 6.5 7). BR, a 是 拟 合 的 
MA(1) 模 型 的 残 差 序列 ， 所 以 它 可 以 自然 地 从 估计 中 得 到 . 
关于 超前 2 步 预测 ， 由 方程 


Hpt2 Co ar Antz 0, ntl 








我 们 有 
T, (2) a) = ch 
en(2) OE 0 
SHIM RAE AN TT FEN Vale (2)j 二 (1 十 0)os， 这 是 模型 的 方差 ， 它 大 于 或 等 于 超前 1 步 预测 误 
差 的 方差 . 上 面 的 结 采 表明 MA(1) 的 超前 2 步 预 测 为 模型 的 简单 无 条 件 均 值 ， 这 一 点 对 任意 
预测 原点 h 都 正确 .更 一 般 地 ， 当 [三 2 i, aOc. 总 而 言 之 ， 对 于 一 个 MA(1) 模 型 ， 
以 为 预测 原点 的 超前 1 步 预 测 为 a 一 Qa,， 超 前 多 步 预 测 为 模型 的 无 条 件 均 值 co. 如 果 我 们 
MH, (V) 相 对 变化 的 图 形 ， 就 会 看 到 超前 1 步 预 测 之 后 的 预测 值 变 成 了 一 条 水 平 下 线 . 
此 ， 对 于 MA(1) 模 型 而 言 ， 均 值 回转 只 需要 一 个 时 间 周 期 . 
类 似 地 ， 对 于 MA(2) 模 型 ， 我 们 有 
TH = CoH Anse — 1 ner — A, 
由 此 得 到 
Tl = 6) — Gia, = 
Li 2) = Cy = Oras 
iO) =e £>2 
这 样 ， 在 2 步 预测 以 后 ，MA(2) 模 型 的 超前 多 步 预测 达到 序列 的 均值 ，2 步 以 后 预测 误差 
的 方差 也 是 序列 的 方差 .一 般 地 ， 对 一 个 MA(g) 模 型 ， 前 g 步 以 后 ， 超 前 多 步 预测 就 达到 
模型 的 均值 . 
K 2-3 给 出 的 是 为 每 权重 指数 的 月 简单 收益 率 建 立 的 形 如 式 (2-25) 中 MA(9) 模 型 的 一 
些 预测 值 ， 预 测 原点 为 二 986(2008 年 2 月 ). 应 用 前 986 个 观测 值 重新 估计 模型 的 参数 . 
序列 观测 值 的 样本 均值 和 样本 标准 差分 别 是 0.0128 和 0.0736. 正如 所 料 ， 表 2-3 说 明 : 
1) 超 前 10 步 预测 值 即 为 样本 均值 ;2) 当 预测 步 数 增加 时 ， 预 测 误差 的 标准 差 趋 于 序列 的 标 
准 差 . 对 这 个 具体 的 例子 ， 由 于 次 贷 危 机 和 雷 紧 兄弟 倒闭 而 引起 的 世界 范围 的 金融 危机 的 
影响 ， 预 测 值 显 车 地 不 同 于 观测 的 真实 值 . 























0.2144 0.0374 -0.1203 -0.0425 0.0232 -0.0302 0.0482 -0.027/6 
s.e. 0.0316 0.0321 0.0328 0.0336 0.0319 0.0318 0.0364 0.0354 


ma9 intercept 
0.1350 0.0122 
s.e. 0.0323 0.0028 


sigma^2 estimated as 0.005043: log likelihood=1220.86, aic=-2419.72 


$% Refined model 


> ml=arima(ew, order=c(0,0,9), fixed=c(NA,0,NA,0,0,0,0,0,NA,NA) ) 


> ml 
arima(x=ew, order=c(0,0,9), fixed=c(NA,0,NA,0,0,0,0,0,NA,NA) ) 
Coefficients: 

mal ma2 ma3 ma4 ma5 ma6 ma7 ma8 ma9 


0.1909 0 -0.1199 0 0 0 0 0 0.1227 
s.e. 0.0293 0 0.0338 0 0 0 0 0 0.0312 


intercept 
0.0122 
0.0027 


Sigma*2 estimated as 0.005097: log likelihood=1215.61, aic=-2421.22 


> sqrt (0.005097) 
[1] 0.07139328 
> 


> Box.test (mlSresiduals, lag=12,type='’Ljung’) % model checking 


Box-Ljung test 
data: mlSresiduals 
X-squared = 17.604, df = 12, p-value = 0.1283 


> pv=l-pchisgq(17.6,9) % compute p-value after adjusting the d.f. 


> pv 
[1] 0.04010828 


%$% To perform out of sample prediction at forecast origin 986. 


> ml=arima(ew[1:986],order=c(0,0,9),f£ixed=c(NA,0,NA,0,0,0,0,0,NA,NA) ) 


> ml 


arima(x = ew[1:986], order=c(0,0,9), £ixed=c(NA,0,NA,0,0,0,0,0,NA,NA) } 
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% 2-3 A CRSP 等 权重 指数 月 简单 收益 率 拟 合 的 MA(9) 模 型 的 样本 外 预测 

步 数 1 Ž 3 4 5 
预测 值 0. 0043 0. 0136 0. 0150 0. 0144 0. 0120 
标准 差 0.0712 0. 0724 0. 0729 0. 0729 0. 0729 
实际 值 — 0. 0260 0. 0312 0. 0322 — 0. 0871 — 0. 0010 
He 6 7 8 9 10 
预测 值 0. 0019 0.0122 0. 0056 0. 0085 0. 0128 
标准 差 0. 0729 6.0725 0. 0729 0. 0729 0. 0734 
实际 值 0.0141 — 0. 1209 — 0. 2060 — 0. 1366 0. 0431 

注 ， 预测 原点 为 2008 年 2 月 ， 即 二 986. 模型 由 精确 极 大 似 然 法 来 估计 . 

> da=read.table("m-ibm3dx2608.txt",header=T) 

> head({da) 

date ibmrtn vwrtn ewrtn sprtn 

1 19260130 -0.010381 0.000724 0.023174 0.022472 

> ew=dasewrtn 

> ml=arima(ew, order=c(0,0,9)) % unrestricted model 

> mil 

arima(x = ew, order = c(0, 0, 9)) 

Coefficients: 

mal maž mas mad mas ma ma” ma 
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Coefficients: 
mal maž ma3 ma4 ma5 maé ma7 mag ma9 intercept 
0.1844 0 -0.1206 0 0 0 0 0 0.1218 0.0128 
s.e. 0.0295 0 0.0338 0 0 0 0 0 0.0312 0.0027 


Sigma*2 estimated as 0.005066: log likelihood =1206.44, aic=-2402.88 
> predict(ml,10) % prediction 
Spred % point forecast 
Time Series: 
Start = 987 
End = 996 
Frequency = 1 
[1] 0.0042826 0.0135589 0.0150242 0.0144534 0.0120463 0.0018056 
[7] 0.0122115 0.0055148 0.0085135 0.0127918 
sse % standard error of prediction 
Time Series: 
Start = 987 
End = 996 
Frequency = 1 
[1] 0.071175 0.072375 0.072375 0.072882 0.072882 0.072882 
[7] 0.072882 0.072882 0.072882 0.073396 


Ny Efi 


下 面 依次 对 AR 模型 和 MA 模型 进行 简要 总 结 . 我 们 讨论 了 以 下 一 些 性 质 : 

。 对 MA 模型 ，ACF 对 模型 的 定 阶 是 有 用 的 ， 因 为 MA(g) 序 列 的 ACK 是 q FRÆK. 

。 对 AR 模型 ，PACF 对 模型 定 阶 是 有 用 的 ， 因 为 ARC») ea PACF 是 p PREH. 

。 MA 序列 总 是 平稳 的 ， 而 对 AR 序列 ， 当 其 特征 根 的 模 都 小 于 工时 ， 它 才 是 平稳 的 . 

。 对 一 个 平稳 序列 ， 超 前 多 步 预测 收 伏 于 序列 的 均值 ， 预 测 误差 的 方差 收敛 于 序列 
HIT a 


2.6 简单 ARMA 模型 














在 有 些 应 用 中 ， 如 有 果 应 用 前 面 介绍 的 2. 4 市 或 者 2.5 市 中 的 模型 ,可 能 第 要 高 阶 的 
AR 或 MA 模型 才能 充分 地 描述 数据 的 动态 结构 ， 这 样 就 有 很 多 参数 要 估计 ， 问题 就 变 得 
繁琐 了 .为 了 克服 这 个 困难 ， 人 们 提出 了 ARMA 模型 ， 参见 Box 等 (1994). ARMA 模型 
的 基本 思想 是 把 AR 和 MA 模型 的 想法 结合 在 一 个 紧 竣 的 形式 中 ,将 模型 参数 的 个 数 保持 
很 小 ， 使 模型 达到 参数 的 简约 化 .该 模型 在 商业 、 经 济 和 工程 时 间 序 列 的 建 模 中 很 有 用 . 
然而 ， 对 金融 中 的 收益 率 序 列 ， 直 接应 用 ARMA 模型 的 机 会 较 少 . 然而 ，ARMA 模型 的 
概念 与 波动 率 建 模 有 密切 关系 .事实 上 ,广义 自 回 归 条 件 异 方差 (Generalized Autoregres- 
sive Conditional Heteroscedastic，GARCH) 模 型 可 以 认为 是 序列 a? 的 ARMA RA, RE 
是 非 标准 的 ， 详 见 第 4 章 . 在 本 市 中 ,我 们 人 研究 最 简单 的 ARMA(1，1) 模 型 . 

称 一 个 时 间 序 列 xz, 服从 ARMAC, DEA, WR z 满足 

Lı —Pi Xia = po = Gy — lia (2-26) 

HHR (a, } AREI 式 (2-26) 的 左边 是 模型 的 AR 部 分 ,右边 是 MA Bor, Fe BAN 
点， 为 了 使 这 样 一 个 模型 有 意义 ， 要 求 册 和 0 ; 否则 ， 在 方程 的 两 端 消去 一 个 公 因 子 , 方 
程 所 决定 的 过 程 变 为 一 个 昌 噪 声 序 列 . 























E ie HF Va] J Z) by R EE R 59 





2.6.1 ARMA(1，1) 模 型 的 性 质 


ARMA(1，1) 模 型 的 性 质 是 ARC1) 模 型 相应 性 质 的 推广 ， 同 时 有 一 些小 的 修正 来 处 理 
MA 部 分 的 影响 ， 首 先 讨 论 平稳 性 条 件 ， 在 式 (2.26) 两 端 取 期 望 ， 得 到 

E(a,) = AE lta) = % + ECa,) —&,ECa4) 
ACA MAAR i ABA ECa)=0, MRETI E FRAN. Wa, 的 均值 为 


这 个 结果 和 式 (2-8) 的 AR(1) 模 型 的 结果 完全 一 样 . 
为 了 简单 起 见 ， 假 定 p=. FERIZI x, 的 自 协 方差 函数 . 首先 ， 在 模型 两 端 乘 
以 a, 再 取 期 望 ， 我 们 有 
天 证 (2-71) 

















把 模型 改写 成 


XL, 9 Ly4 m Ur We | 





对 上 式 两 端 取 方差 ， 得 到 
Var(z) = HVE 90 HO E(xr, 1a,1) 
这 里 我 们 用 到 c- a, 不 相关 这 一 事实 . 利用 式 (2-27)， 我 们 得 到 
Var(z:) — gee (lime, 0 + Oo, 
从 而 ， 寿 序列 x, 是 弱 平 稳 的 ， 则 Var(z,)=Varlz,1), HA 
Clapton, ) 
1— ¢; 
因为 方差 是 正 的 ， 所 以 我 们 需要 AKLA |<. MA ARG) 模 型 的 平稳 性 条 件 一 样 . 
为 了 得 到 zz, 的 目 协 方差 函数 ， 我 们 假定 各 二 0， 并 在 式 (2-26) 两 端 污 以 x,,， 得 到 
or OR eE a 
对 《二 1， 在 上 式 两 端 取 期 望 并 利用 :一 1 时 的 式 (2-27)， 我 们 有 
%1 — 8% 0 
其 中 ， y,=Cov(az,, x,-,). 这 个 结果 不 同 于 AR(1) 情 形 ， 对 AR(1) 模 型 有 yi — 41% =0. 
然而 ， 对 [二 2， 取 期 望 后 ， 可 以 得 到 
Yz —$ıyı = 0 
这 与 AR(1) 情 形 一 样 .， 事实 上 ， 用 相同 的 方法 可 得 到 
Yer =90 €>1 (2-28) 
对 于 ACF， 上 述 结 末 表 明 对 平稳 ARMAC, DRN, A 
Oo. 
Yo 
x. ARMAC, DRAHY ACF 与 AR(1) 模 型 的 ACF 很 相似 ， 不 同 之 处 仅 在 于 它 的 指数 
衰减 是 从 间隔 2 开始 的 ， 因此 ，ARMA(1，1) 模 型 的 ACF 不 能 在 任意 有 限 间 隔 后 截 尾 . 
现在 来 看 偏 自 相 关 函 数 (PACF).， 可 以 证 明 : ARMAC, DEWA PACF 也 不 能 在 有 
BRIE Ja Me. 它 与 MA(1) 模 型 的 PACK 表现 很 相似 ， 只 是 指数 衰减 从 间隔 2 开始， 而 不 
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是 从 间隔 1 开始 . 

综 上 所 述 ，ARMA(1，1) 模 型 的 平稳 性 条 件 与 AR(1) 模 型 的 相同 ，ARMA(1，1) 模 型 
的 ACF 与 AR(1) 模 型 的 ACF 有 相似 的 模式 ， 只 是 这 种 相似 模式 是 从 间隔 2 开始 的 . 
2. 6.2 一 般 ARMA 模型 

一 般 ARMA(p,，9g) 模 型 的 形式 为 

.if 一 Po + D> hss + A, Dae 
FO (a) 2 ALR. p 和 9g 都 是 非 负 整数 . AR 模型 和 MA 模型 都 是 ARMAC, oh 
特殊 情形 . 利用 延迟 算 子 ， 上 述 模型 可 写成 
(l1—¢,B—-++—$¢,B")z, 一 页 十 (1 一 和 B 一 … 一 人 By)a， 9 

其 中 1—¢,B—-++-—¢,B? 是 模型 的 AR 多 项 式 ， 类 似 地 ，1 一 0B 一 … 一 02.B? 为 模型 的 MA 多 项 
sh. 我 们 要 求 AR 多 项 式 和 MA 多 项 式 没 有 公 因 子 ， 否则 模型 的 阶 (p，9g) 会 降低 .与 AR 模 
型 一 样 ，AR 多 项 式 引 进 了 ARMA 模型 的 特征 方程 ， 如 果 特 征 方程 所 有 解 的 绝对 值 都 小 于 1， 
则 该 ARMA 模型 是 弱 平 稳 的 . 这 时 ， 模 型 的 无 条 件 均 值 为 El) =p Adhe). 


2.6.3 ARMA 模型 的 识别 











在 给 ARMA 模型 定 阶 时 ，ACF 和 PACF 都 不 能 提供 足够 的 信息 .Tsay 和 Tiao(1984) 
提出 一 个 新 方法 ， 它 利用 推广 的 目 相 关 图 数 (Extended Autocorrelation Function, EACF) 
来 确定 ARMA 过 程 的 阶 ， EACF 的 基本 思想 相对 比较 人 简单. 如 果 我 们 能 得 到 ARMA 模型 
的 AR 部 分 的 相合 估计 ， 则 能 推 吐 出 MA 部 分 ， 对 所 推导 出 的 MA 序列 ， 我 们 可 以 应 用 
ACF 确定 MA 部 分 的 阶 . 

EACF 的 推导 相对 复杂 一 些 ， 细 节 人 参见 Tsay 和 Tiao(1984). 但 此 函数 用 起 来 是 容易 
I. EACF 的 结 采 可 以 用 一 个 二 维 表 格 表 示 ， 表 的 行 对 应 于 AR 的 阶 p， 列 对 应 于 MA 的 
Brg. ARMA(1，1) 模 型 的 EACF 的 理论 形式 由 表 2-4 给 出 .这 个 表 的 主要 特征 是 : 它 包 
含 由 “07 组 成 的 三 角形 ， 并 且 这 个 三 角形 左上 角 顶 点 位 于 阶 (1，1) 处 .我 们 正 是 用 这 样 的 
特征 来 识别 ARMA 过 程 的 阶 ， 一般 地 ， 对 ARMA(p, 9) 模 型， 由 “O” 组 成 的 三 角形 的 左 
上 角 顶 点 位 于 (p，9) 处 . 


表 2-4 ARMA(1，1) 模 型 的 理论 EAF 表 ， 其 中 “X” 代 表 非 零 ，“O” 代 表 零 ， 
“x ”代表 零 或 者 非 零 

















MA 
AR 0 1 2 3 4 5 6 7 
0 X X X X X X X X 
1 X O O O O O O O 
2 * X O O O O O O 
3 * * X O O O O O 
4 * x x X O O O O 
5 x x x x X O O O 


È: 它 在 识别 阶 (1，1) 时 不 起 任何 作用 . 


作为 例子 ， 考 虑 3M 公司 股票 从 1946 年 2 月 到 2008 年 12 月 的 月 对 数 收益 率 ， 共有 


ES ik HF Va] Ap FY) KG Ze oH A A! 


61 





755 个 观测 值 ， 收 益 率 序列 和 它 的 样本 自 相 关 函 数 如 图 2-15 所 示 . 该 ACF 图 表明 在 1% H 
水 平 下 数据 没有 显著 的 前 后 相关 性 . 表 2-5 给 出 了 序列 的 样本 EACF 值 和 对 应 的 一 张 稍 化 
R. BRA SCA 软件 包 得 到 .也 可 以 用 RR RME TSA 来 计算 EACF， 具 体 参 见 下 面 的 














注 记 ,这 张 简 化 表 是 用 如 下 记 志 来 构造 的 : 


图 2-15 


R 2-5 3M 公司 股票 从 1946 年 2 月 到 1997 年 12 月 的 月 对 数 收 益 率 的 样本 EACF RAR 


0.1 


l=-return 


—(). 1 


0.3 


ACF 
0.0 0.2 0.4 0.6 0.8 1.0 


1950 


1960 


1970 


1980 


Year 


Series : mmm 


Lag 


3M 公司 股票 从 1946 年 2 月 到 2008 年 12 月 的 月 对 数 收益 率 的 时 序 图 和 样本 自 相关 函数 图 





1990 


2000 





2010 








a) FF AS HE) AI A AHK PRA 
MA 的 阶 : q 
P 0 1 2 3 4 5 6 7 8 9 10 11 12 
0 一 0.06 一 0.04 一 0.08 一 0. 00 0. 02 0. 08 0.01 0.01 一 0.03 一 0.08 0.05 0.09 一 0.01 
1 一 0. 47 0.01 一 0.07 一 0.02 0. 00 0.08 一 0.03 0.00 一 0.01 一 0.07 0. 04 0.09 一 0.02 
2 三 0.38 =0.35 =O. U7 0.02 一 0.01 0. 08 0.03 0.01 0.00 一 0. 03 0. 02 0. 04 0. 04 
3- 三 0.18 0. 14 0.38 一 0.02 0. 00 0.04 一 0.02 0.02 —0.00 一 0.03 0. 02 0.01 0. 04 
4 0. 42 0. 03 0.45 —0. 01 0. 00 0.00 —0.01 0.03 0. 01 0. 00 0.02 一 0. 00 0. 0l 
5- =|. ll 0. 21 0. 45 0. 01 0.20 —0.01 一 0.00 0.04 一 0.01 一 0.01 0. 03 0. 01 0. 03 
6 一 0.21 一 0.25 0. 24 0. 31 0.17 一 0.04 一 0.00 0.04 一 0.01 一 0.03 0. 01 0.01 0. 04 
b) 简 化 的 EACF 表 
MA 的 阶 : q 
P 0 1 2 3 4 9 6 7 8 9 10 11 12 
0 O O X O O X O O O X O X O 
1 X O O O O X O O O O O X O 
2 X X O O O X O O O O O O O 
3 X X X O O O O O O O O O O 
4 X O X O O O O O O O O O O 
5 X X X O X O O O O O O O O 
6 O X X X X O O O O O O O O 
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1)“X” 表 示 对 应 的 EACF 的 绝对 值 大 于 或 等 于 上 EACF 渐 近 标准 误差 的 两 倍 . 

2) “O” RIRI DLE EACF 的 绝对 值 小 于 EACF 渐 近 标准 误差 的 两 倍 . 

可 以 应 用 2. 2 节 中 的 Bartlett 公式 来 计算 EACF 的 标准 误差 ,或 者 简单 地 用 2/,/T, 
其 中 械 为 样本 容量 . 该 简化 表 显 示 由 “0” 组 成 的 三 角形 的 左上 和 角 顶 点 位 于 阶 (p，g) 二 (0， 
0) 处 ， 当 gq 二 2、5、9 和 11 时 ， 有 少数 “X” 是 例外 的 . 然而 ， 该 EACF 表 显 示 对 应 这 些 “X” 


的 样本 ACF 值 大 约 为 0.08 或 者 0.09， 这些 ACF (AA H 2/./755=0.073 稍 大 一 点 .事实 
E. WRH 1% 的 临界 值 ， 简 化 表 中 的 这 些 “X” 将 变 为 “4CO0” 因此 ，EACF 表明 3M 公司 股 
RH AT BU at HRA S ARMA(0，0) 模 型 (也 就 是 一 个 日 噪声 序列 ). 这 与 图 2-15 中 
样本 ACF 所 表明 的 绪论 是 一 致 的 . 

注 记 : 可 以 用 Csi 和 Chan(2010) 年 开发 的 R 添 加 包 TSA 来 计算 EACF. SCA 软件 


包 应 用 Bartlett 公式 来 构建 EACF HMR, 而 TSA 添加 包 则 用 2/VT 作 为 所 有 EACF 的 标 
准 误差 . 对 3M 股票 的 收益 率 序 列 ，R 的 输出 如 下 所 示 . E 
R 代码 演示 
> da=read.table("m-3m4608.txt",header=T) 
> head (da) 
date rtn 


1 19460228 -0.077922 
> mmm=log(da$rtn+1) 
> 
> 














library (TSA) % Load the package 

ml=eacf (mmm, 6,12) % Simplified table 
AR/MA 

01l 2365 678 9 10 T1 ie 
00 60% ORO: OORO xX O 
1 OE HCO OO KX OC 
4X KI OO XO OO OO O&O OC 
3 3 O10 60:0 6.005 O Ò 
SX Oi WG: OG oO OO Go 6 
SE EE OOO Oo Oo O 6 
GS Se BE OO OO Oa O 9 
> names (m1) 
[1] "“eacf" "ar.max" “ma.ma" "symbol" 
> print (ml$eacf,digits=2) 

{,1] [,2] [,3] [,4] [,5] [,6] (,7] [, 8] (4:9) 

[1,] -0.056 -0.038 -0.082 -0.005 0.018 0.0821 0.0080 0.0127 -0.0301 
[2,] -0.474 0.010 -0.074 -0.021 0.002 0.0772 -0.0288 0.0026 -0.0068 
[3,] -0.383 -0.348 -0.074 0.016 -0.006 0.0772 0.0269 0.0120 0.0004 
[4,] -0.177 0.138 0.384 -0.022 0.002 0.0419 -0.0232 0.0154 -0.0044 
[5,] 0.421 0.029 0.454 -0.008 0.001 0.0025 -0.0140 0.0305 0.0116 
[6,] -0.114 0.214 0.449 0.010 0.202 -0.0063 -0.0038 0.0403 -0.0129 
[7,] -0.3208 -0.250 0.243 0.311 0.168 -0.0388 -0.0034 0.0429 -0.0101 


[,10] [,11] [12] {;1I3] 


[1,] -0.078 0.0488 0.0909 -0.011 
[2,] -0.069 0.0372 0.0938 -0.024 
[3,] -0.027 0.0221 0.0428 0.042 
[4,] -0.025 0.0185 0.0100 0.043 
[5,] 0.004 0.0191 -0.0043 0.013 
[6,] -0.012 0.0315 0.0117 0.028 
[7,] -0.026 0.0078 0.0106 0.037 
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前 面 所 讨论 的 信息 准则 也 可 以 用 来 选择 ARMA 模型 具体 地 说 ， 对 于 事先 指定 的 正 
整数 已 和 Q， 计 算 ARMAC, ENH AIC( 或 BIC), FEA O<p<P, 0X<qXQ,. VHA 
AIC( 或 BIC) 取 最 小 值 的 模型 .该 方法 需要 许多 模型 的 最 大 似 然 估计 ， 在 一 些 情 形 下 可 能 
会 碰 到 在 估计 时 过 度 拟 合 的 困难 . 

— H ARMA(p,，9) 模 型 的 阶 确定 了 ， 就 可 以 用 条 件 似 然 法 或 者 精确 似 然 法 来 估计 模型 








WB. Oh, RÆ Ljung-Box 统计 量 可 以 用 来 检验 所 拟 合 模型 的 充分 性 . 如 果 模 型 是 
正确 的 ，QGm) 渐 近 地 服 从 自由 度 为 m 一 g 的 Xx Ati. HER g 表示 所 用 模型 的 AR 或 者 MA 
参数 的 个 数 . 
2.6.4 FR ARMA 模型 进行 预测 

和 ACF 的 表现 类 似 ， 只 要 将 MA 部 分 对 低 期 数 预 测 的 影响 进行 调整 ， ARMAC, q) 
模型 的 预测 与 AR(p) 模 型 的 预测 有 相似 的 特征 . 设 预 测 原 点 为 h，F 为 在 hh 时刻 所 能 得 到 
的 信息 集合 . 超前 1 步 预 测 为 

ZX, (1) 一 Ela pe.) = Po Si > ae A 
相应 的 预测 误差 为 Ch C1) =2a41 一 715 =a. 超前 iL 步 预测 误差 的 方差 为 VarLe, (1) |= 
o.. REA 2 步 预 测 ， 我 们 有 
2,0) = E(x |F ee: 2. @eei) 一 > 0a, i) 
其 中 ， 40-70 时 ， a (4-1) = XT, i; =z Low ie 时 ， a, €—i1)=0; 而 当 A 时 ， 
ai《(l 一 二 a,14s_;. 这 样 ，ARMA 模型 的 超前 多 步 预 测 可 以 递 推算 得 . 相应 的 预测 误差 为 
@ (2) gla), g E (£) 

它 可 以 用 下 一 市 给 出 的 式 (2-35) 很 容易 地 算出 . 


2. 6.5 ARMA 模型 的 三 种 表示 方式 








在 这 一 小 节 中 ， 我 们 价 单 地 讨论 平稳 ARMA(p，9g) 模 型 的 三 种 表示 .这 三 种 表示 用 于 三 
种 不 同 的 目的 . 了解 这 三 种 表示 可 以 更 好 地 理解 ARMA 模型 ,第 一 种 表示 是 式 (2-29) 给 出 的 
ARMA(P，9) 模 型 ， 这 个 表示 很 紧凑 并 且 在 参数 佑 计时 有 用 为 外 ， 它 在 递 推 计 算 x, 的 
超前 多 步 预 测 时 也 有 用 ， 见 上 一 节 的 讨论 . 


对 万 外 两 种 表示 ， 我 们 用 两 个 多 项 式 的 长 除法 给 定 两 个 多 项 式 OCB) = 2 和 














&(B) 一 1 一 ae ， 通 过 长 除法 ， 我 们 有 
= TB + = (2-30) 


和 
ese a a (2-31) 


[83] 


á Z 2# 





miu., 4 46(B)=1—-¢,B, 0B)=1—4B, WMA 








p(B) — 5 =l ($: — M) B+ $ (4, 一 外) 有 + $i (9; — 0) B’ me 
— 1— 4B a. _ 2 2 时 3 ,os 
区 (万 ) — 1—@,B T 1 (h 0) B 0, (4, G,)B Gi (4, G,)B 


由 定义 知 PCB) eC BY=1, AIA Bo=c 对 任意 常数 c 成 立 这 个 事实 (因为 常数 是 不 随时 间 变 化 
的 )， 我 们 有 

















h $, a $ $, 
Q(1) LG), am o(1) 19) = =, 

AR 表示 

利用 式 (2-31) 的 结果 ，ARMA(p，g) 模 型 可 写成 
Ly 一 1—4, = E 0, = eee See 2， i T3 X13 ape ae Gy (2-32) 





这 个 表示 给 出 了 当前 收益 率 x, 对 过 去 收益 率 x,_; 的 依赖 关系 ， 这 里 iD RAA MA 
ARMA {WHJ r AEC weight). AS pata oT x, 的 贡献 随 i 的 增 大 而 消失 ， 系 
Wx, 应 随 i 增 大 而 趋 于 零 . 一 个 具有 这 样 性 质 的 ARMA(p,， 9g) 模型 ， 称 为 可 道 的 .对 纯 
AR 模型 ，0(B) 二 1， 故 x(B) 二 $8(B)， 这 是 一 个 有 限 阶 的 多 项 式 .， 从 而 对 i 二 zp 有 Xi 二 0， 
模型 是 可 道 的 .对 其 他 ARMA 模型 ， 可 道 性 的 充分 条 件 是 : 多 项 式 90(B) 的 所 有 零点 的 模 
大 于 1. 例如， 对 MACEN xz, 二 (1 一 9.B)a,， 一 次 多 项 式 1 一 0.B 的 零点 是 B 一 1/0.. 从 
而 ， 如 果 |1/0. | 二 1( 即 19 (<1), WW MAC) 25) pi Ay. 

由 式 (2-32) 的 AR 表示 ， 一 个 可 道 的 ARMA 序列 x, 是 当前 的 扰动 w 与 序列 过 去 值 的 
加 权 平 均 的 线性 组 合 . 对 越 来 越 遥 远 的 过 去 值 ， 权 重 呈 指数 衰减 . 








MA 表示 
同样 ， 利 用 式 (2-30) 长 除法 的 结果 ，ARMA(p， 9g) 模 型 也 可 以 写成 
Tı — uT ar pam + pam i 3 ut y(B)a, (2-33) 
其 中 ,yy 二 E(x) 二 和 /一 各 一 … 一 各 )， 该 表示 形式 清楚 地 说 明了 过 去 的 扰动 a G0) Hf 4A 


收益 2, 的 影响 ， 系 数 4w PRA ARMA 模型 的 脉冲 响应 函数 (impulse response function). 对 能 平 
稳 序 列 ， 系 数 y 随 i 的 增加 呈 指 数 衰减 . 这 一 点 是 可 以 理解 的 ， 因 为 扰动 a ;对 收益 率 x, 的 影 
啊 应 该 随时 间 的 流逝 而 消失 .这样 ， 对 平稳 ARMA 模型 ， 扰 动 a ;不 能 对 序列 有 永久 的 有 影响. 
如 果 $470, ABA MA 表示 中 就 有 一 个 常数 项 ， 它 就 是 xz, 的 均值 ( 即 A/A h ee). 
式 (2-33) 的 MA 表示 在 计算 预测 误差 的 方差 时 也 有 用 .在 预测 原点 丸 ， 我 们 有 扰动 a, 
0 1，… 从 而 ， 超 前 2 步 预测 为 
Xn O = wt Wan t+ dena te (2-34) 








相应 的 预测 误差 为 
enr) = Gig i T T ra 
因此 ， 超 前 2 步 预测 误差 的 方差 为 
Varle, O] = Ath tes +d da (2-35) 
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正如 所 料 ， 它 是 预测 时 间 长 度 2 的 非 减 函数 . 

最 后 ， 式 (2-33) 的 MA 表示 还 提供 了 平稳 序列 均值 回转 的 一 个 简单 证 明 . 平稳 性 意味 
着 当 ;一 co 时 y; FE. 从 而 ， 由 式 (2-34)， RNAS COON, (0) 一 ux， 因为 2 (1) 是 
Zi 在 预测 原点 贿 的 条 件 期 望 ， 所 以 上 述 结 果 说 的 是 ， 从 长 期 来 看 ， 收 益 率 序列 预期 会 趋 
于 它 的 均值 ， 也 就 是 说 ， 序列 是 均值 回转 的 . 而 且 ， 由 式 (2-33) 的 MA Rm, RMA 


Var(x,) = (1+ Sg Jo! . Am, Fast (2-35), 4 ¢>ooht, RMA Varle, (1) J>Var(z,). 
r O ËT po 的 速度 决定 了 均值 回转 的 速度 . 
2.7 单位 根 非 平稳 性 


到 目前 为 止 ， 我 们 的 注意 力 还 是 集中 在 平稳 的 收益 率 序 列 上 .， ERER, AR, 
汇率 、 资 产 的 价格 序列 是 研究 的 对 象 ， 这些 序列 往往 是 非 平 稳 的 .对 于 资产 价格 序列 ， 其 
非 平 稳 性 主要 是 由 于 价格 没有 固定 的 水 平 . 在 时 间 序 列 文 献 中 ， 这 样 的 非 平 稳 序 列 叫做 单 
位 根 非 平稳 时 间 序 列 (unit-root nonstationary time serise). 单位 根 非 平稳 时 间 序 列 最 著名 
的 例子 是 随机 游 动 模型 . 


2.7.1 随机 游 动 
在 时 间 序 列 42,}》 满 足 























> = Na; (2-36) 

其 中 p 是 实数 ， 它 表示 该 过 程 的 起 始 仁 ， 而 4\c, /是 日 噪声 序列 ， 则 称 142, /为 一 个 随机 游 动 
(random walk). Æ p 为 一 只 股票 在 第 t 天 的 对 数 价格 ， 则 po 可 以 是 该 股票 最 初 上 市 (ini- 
tial public offering) 的 对 数 价 格 ( 即 对 数 IPO 价格 ). Ba 的 分 布 关于 零点 对 称 ， 则 给 定 
ba RIEF, p 上 升 或 下 降 的 机 会 各 有 50%， 即 p 将 随机 地 上 升 或 下 降 ， 如 果 我 们 把 随 
机 游 动 模型 看 成 一 个 特殊 的 AR(1) 模 型 ， 那么 p,-1 的 系数 是 1， 这 不 满足 AR(1) 模 型 平稳 性 
的 条 件 . 从 而 ， 随 机 游 动 序列 不 是 弱 平 稳 的 ， 我 们 称 之 为 单位 根 非 平 稳 时 间 序 列 . 

随机 激动 模型 被 广泛 地 用 来 作为 对 数 股 票 价 格 运动 的 统计 模型 . 在 这 样 的 梗 型 下 ， 股 
价 是 不 可 预测 的 或 非 均值 回转 的 .为 说 明 这 一 点 ， 下 面 写 出 式 (2-36) 所 给 模型 在 预测 原点 
h 的 超前 1 步 预 测 ， 如 下 所 示 : 

Br) = EC pmi | Pas Praises) = ps 
Ee ae FOU DR PC GP. CE TO eS RE 2 步 预 测 为 
Bi (2) = EC prre | Pao Pratt) = EC priri + arra | Pro bras) 
= EC pin | Prs Pris) = Êa) = py 
这 又 是 预测 原点 的 对 数 股价 ， EKE, OE MW A 0, RWA 
B.D = pr 

这 样 ， 对 所 有 预测 步 长 ， 随 机 游 动 模型 的 点 预测 都 是 序列 在 预测 原点 的 值 . 从 而 ， 该 过 程 
不 是 均值 回转 的 . 

式 (2-36) 给 出 的 随机 游 动 模型 的 MA 表示 为 


























B6] 





a7 | 


dij Z 2# 





Dp = i Täna Se 十 eee 
这 个 表示 有 几 个 重要 的 实际 意义 ， 第 一 ， 超 前 上 步 预测 误差 为 

er U) = apa aes 
从 而 Varle.(Q J=lo., K >o, BTR BB oo, Alt, Raa MARTE. Pre 
预测 区 间 的 长 度 将 趋 于 无 穷 ， 这 表明 ， 随 看 CA, UD, ORAH, Re ARIK 
说 明 该 模型 不 是 可 预测 的 ， 第 二 ， 因 为 当 2 增 大 时 ，VarLe' (© JH FAH. p 的 无 条 件 方 
差 是 无 界 的 ， 从 理论 上 讲 ， 这 意味 着 对 充分 大 的 入 pe 可 取 到 任何 实 值 .对 个 股 的 对 数 价 
格 来 说 ， 这 一 点 还 说 得 过 去 . 但 对 市 场 指数 来 讲 ， 负 的 对 数 价 格 即使 有 也 是 很 罕见 的 ， 从 
这 个 意义 上 讲 ， 随 机 游 动 村 型 对 市 场 指数 的 适合 性 值得 怀疑 . 第 三 ， 从 上 述 表 示 看 ， 对 所 
有 i 有 y; 王 1， 这 就 是 说 任何 过 去 的 扰动 a, ;对 p, 的 影响 不 随时 间 育 减 . 从 而 ， 该 序列 有 强 
记忆 性 ， 因 为 它 记 得 所 有 过 去 的 扰动 从 经 济 学 上 讲 ， 就 是 扰动 对 序列 有 持久 的 效应 ， 单 
位 根 时 间 序 列 的 强 记 忆 性 也 可 以 从 所 观测 序列 的 样本 ACF 看 出 来 . 当 样 本 容量 增 大 时 ， 样 
本 ACF 都 趋 于 1. 


2.7.2 市 漂移 的 随机 游 动 


到 目前 为 止 ， 前面 考虑 的 一 些 实 证 例子 中 ,市场 指 数 的 对 数 收 益 率 序列 倾 和 加 于 有 一 个 
较 小 的 正 均值 .这 意味 着 对 数 价 格 的 模型 应 为 
J jo os (2-37) 
其 中 SE, =p), (a) xe SY (EY FBR A. EAC (2-37) P AI A AC jy 在 金融 
人 研究 中 是 很 重要 的 . 它 表示 对 数 价格 p, 的 时 间 趋 势 ， 通 党 称 为 模型 的 漂移 (drift)， AS ve 
明 这 一 点 ， 我 们 假定 初始 价格 为 pos AMRA 
pi = pee ee 
bp: = pt pi Par = eet pot a: t a 






































Di = tu | Po | a; | G3 了 
上 式 中 最 后 一 个 等 式 表 明 对 数 价格 由 时 间 趋 势 如 和 一 个 纯 随 机 游 动 过 程 Ja 组 成 .因为 








t 


Var( Jai) = toi» EP oi Na, 的 方差 ， 户 的 条 件 标准 差 为 fc.， 所 以 它 增长 的 速度 比 p 


的 条 件 期 望 慢 ， 从而， 如 采 我 们 画 出 p, 随时 间 指 标 t 变化 的 图 形 ， 我 们 有 一 个 和 斜 卒 为 的 
Ep a] EA. ERRE po 意味 着 对 数 价格 最 终 趋 于 oo; FAIR. TURE AS y 意味 看 对 数 价 格 将 趋 
Foo, SPIE PAE. CRSP 价值 加 权 和 等 权重 指数 的 对 数 收益 率 序 列 有 小 的 、 但 统计 
显著 的 正 均 值 这 个 现象 就 不 足 为 奇 了 . 

为 了 说 明 价 格 序 列 深 移 参数 的 效应 ， 我 们 考虑 3M 公司 股票 从 1946 年 2 月 到 2008 年 
12 月 的 月 对 数 收 益 率 .如 表 2-5 中 的 样本 EACF 所 示 ， 该 序列 无 显著 的 前 后 相关 性 . 该 序 
列 服从 下 列 简单 梗 型 




















æ, = 0:0103 Fa,» 6, = 0. 0637 (2-38) 
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其 中 0. 0103 Æ x, 的 样本 均值 ， 其 标准 误差 为 0.0023. 3M 公司 股票 的 月 对 数 收益 率 在 1% 
的 水 平 下 是 显著 不 等 于 0 的 . 事实 上 ， 应 用 单 样本 的 零 均 值 检 验 , zt 比 的 值 为 4.44， 相 应 
W p 值 接近 于 0. 我们 利用 对 数 收益 率 序 列 来 构造 两 个 对 数 价格 序列 : 


p = D7 和 pf 二 Dja 
其 中 a; 是 式 (2-38) 中 的 均值 修正 对 数 收 益 率 ( 即 a, =x, — 0. 0103). p, 是 3M 公司 股票 的 对 数 
价格 ， 假 设 初始 价格 为 0( 即 1946 年 1 月 的 对 数 价格 为 0). z 是 当 对 数 收益 率 的 均值 为 0 时 
对 应 的 对 数 价格 . 图 2-16 显示 了 p, 和 pi 的 时 序 图 和 直线 y, =0.0103 Xt+1946, HP zk 
痊 率 序列 对 应 的 时 间 区 间 ， 而 1946 则 是 该 股票 的 首次 上 市 日 期 ， 从 图 2-16 中 可 以 看 出 ， 
IL (2-38) PAE BK 0. 0103 的 重要 性 是 明显 的 . 另外 ， 如 我 们 所 料 ， 该 常数 代表 p, 上 升 趋势 的 斜率 . 
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图 2-16 3M 公司 股票 从 1946 年 2 月 到 2008 年 12 月 的 对 数 价 格 时 序 图 假定 1946 1 AY 
对 数 价 格 为 0. “o” 为 没有 时 间 趋 势 的 对 数 价格 ,直线 为 % =0. 0103 义 上 十 1946 


常数 项 的 解释 

从 前 面 几 市 的 讨论 中 可 以 看 出 ， 理 解 时 间 序 列 模型 中 常数 项 的 意义 是 重要 的 . 第 一 ， 对 
式 (2-22) 中 MA(g) 模 型 ， 营 数 项 就 是 序列 的 均值 ; 第 二 ， 对 式 (2-9) 中 的 平稳 AR(p) 模 型 或 
式 (2-29) 中 的 平稳 ARMACp, QRA, WAM BAK, HRAA p= h/A-b - 
bys He MPS NY BE OLD Be ICTY AO SEA ET BRS. HE SEE EN E et) a 
型 中 常数 项 的 不 同 解 释 ， 清 楚 地 阐明 了 动态 模型 与 通常 的 线性 回归 模型 之 间 的 不 同 . 

动态 模型 与 回归 模型 之 间 的 另 一 个 重要 差别 可 以 用 AR(1) 模 型 和 简单 线性 回归 模型 来 
说 明 : 
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要 使 AR(1) 模 型 有 意义 ， 其 系数 加 必须 满足 | | 三 1， 然 而 ,系数 B 可 以 是 任何 固定 的 
实数 


2. 7.3 趋势 平稳 时 间 序 列 


与 市 有 线性 趋势 的 模型 紧密 相关 的 模型 是 如 下 的 趋势 平稳 时 间 序 列 模型 : 
pe = p Hetta 
其 中 x, 是 一 个 平稳 时 间 序 列 ， 例 如 平稳 AROFA. AE, p, 随时 间 以 p WER RE 
长 ， 因 此 它 呈 现 出 类 似 于 市 深 移 的 随机 游 动 模型 的 行为 ， 然而， 这 两 个 模型 有 一 个 主要 的 
区 别 . 为 了 说 明 这 一 点 ,假定 Do 是 固定 的 . 市 漂移 的 随机 游 动 模型 假定 均值 是 E(p) 二 po 
十 ut， 方 差 是 Var(p,) 王 to， 这 两 者 都 依赖 于 时 间 . 男 一 方面 ， 趋 势 平 稳 时 间 序 列 模型 假 
定 均值 是 EE(p,) 一 BB 十 Bi1t， 它 依赖 于 时 间 ; 而 方差 是 Var(p,) 一 Var(zx,)， 它 是 有 限 的 并 且 
不 随时 间 变 人 化， 趋势 平 稳 时 间 序 列 模 型 可 以 通过 简单 的 线性 回归 分 析 移 除 挥 时 间 趋 势 而 转 
换 为 平稳 时 间 序 列 . 关于 趋势 平稳 时 间 序 列 模型 的 分 机， 参见 2. 10 市 中 的 方法 . 


2.7.4 一 般 单位 根 非 平稳 模型 


考虑 ARMA 模型 . 如 果 我 们 把 ARMA 模型 进行 推广 ， 人 允许 其 特征 多 项 式 以 1 作为 它 
的 特征 根 ， 则 模型 就 变 成 了 众所周知 的 自 回归 求 和 移动 平均 (Autoregressive Integrated 
Moving Average，ARIMA) 模 型 . 因为 其 AR 特征 多 项 式 有 单位 根 ， 所 以 该 ARIMA 模型 
称 为 是 单位 根 非 平 稳 的 . 像 随机 游 动 模型 一 样 ，ARIMA 模型 有 强 记 忆 性 ， 因 为 它 的 MA 
表示 中 的 y; 系数 不 随时 间 衰 减 ， 这 意味 者 过 去 的 扰动 a,_; 对 序列 有 持久 效应 . 人 处理 单位 根 
韭 平稳 性 的 惯用 方法 是 用 差分 (differencing) 方 法 . 

差分 

如 宁 一 个 时 间 序 列 y 变换 后 的 序列 < 二 yy 一 yi 二 (1 一 B)y, 服从 一 个 平稳 可 逆 的 
ARMA(p，g) 模 型 ， 则 称 该 序列 为 一 个 ARIMA(p，1，g) 过 程 ， 在 金融 中 ， 通 常 认为 价格 序 
列 是 非 平稳 的 ， 而 对 数 收益 率 序 列 x 二 ln(p,) 一 ln(p, i) 是 平稳 的 . 这 时 ， 对 数 价格 序列 是 单 
位 根 非 平稳 的 ， 从 而 可 当做 ARIMA 过 程 对 待 . 在 时 间 序 列 文献 中 ， 通 过 考虑 时 间 序 列 相 邻 
两 值 的 变化 量 所 构成 的 序列 ， 把 一 个 非 平 稳 序 列 变换 成 一 个 平稳 序列 ， 这 样 的 思想 称 为 差分 
方法 . 更 形式 化 地 说 ， 称 c 一 yw 一 y 一 为 y 的 一 阶 差分 序列 ， 在 某 些 科学 领域 ， 时间 序列 
yi 可 能 会 有 多 重 单 位 根 ， 需 要 做 多 次 差分 才能 变 成 平稳 序列 例如， 奎 y, 和 它 的 一 阶 差分 
序列 c, 王 wy 一 y ;都 是 单位 根 非 平稳 的 ,但 y=c 一 c 一 yy 一 2y 1 十 y, ;是 弱 平稳 的 ， 则 y, 
就 有 双重 单位 根 ，s, 是 y, 的 二 阶 差 分 序列 . 另外, As, 服从 ARMA(p，9) 模 型 ， 则 y, 是 
ARIMA(p, 2, 9g) 过程 。 对 这 样 一 个 时 间 序 列 ， 奉 s, 有 非 零 的 均值 ， 则 y, 有 一 个 二 次 时 
间 隐 数 ， 该 二 次 时 间 函 数 的 系数 与 s, 的 均 什 有关. 经 过 季节 调节 后 的 美国 季度 国内 生产 总 
值 CGDP) 暗 含 的 通货 紧缩 Cimplicit price deflator) 序 列 可 能 有 双重 单位 根 . 然而 ， 该 序列 的 
二 阶 差 分 序列 的 均值 不 是 显著 地 不 同 于 去， 具体 内 容 参见 本 章 的 习题 . Box 等 (1994) 讨 论 
了 一 般 ARIMA 模型 的 很 多 性 质 . 
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2.7.5 单位 根 检验 


为 了 检验 资产 的 对 数 价格 p, 是 否 服从 随机 游 动 或 市 深 移 的 随机 游 动 ， 我 们 利用 如 下 两 
个 模型 





Pe = Pip te, (2-39) 

P= po +h pa +e, (2-40) 
其 中 e 为 误差 项 ， 考 虑 原 假设 Ay $i = 1 和 备 择 假设 瓦 .: 轴 过 1. 这 就 是 车 名 的 单位 根 检验 
问题 (Dickey 和 Fuller，1979)， 一 个 方便 的 检验 统计 量 就 是 在 原 假 设 下 由 的 最 小 二 乘 估计 
Ay t EK. 对 式 (2-39) ， 最 小 二 乘法 给 出 








> Pudi >» @ =O P45) 
_ t=i1 m9 = t=1 
aa =a 1 
> Bs 
其 中 po =0, T HERRE. t 比 为 
$, at | Dy brie 


DF=: kh = 








2, HEE 7 
om | > pi 


AF t ECU AY PKA Dickey-Fuller 44. A lele MARET, HI a Bor E EA R 
AY, M Tort DF 统计 量 收敛 到 标准 布 肯 运 动 的 一 个 函数 ， 更 多 的 信息 参见 Chan 和 Wei 
(1988) 以 及 Phillips(1987). WR fp =0, 但 我 们 采用 式 (2-40)， 则 所 得 的 检验 加 二 1 的 上 比 将 趋 
于 为 一 种 非 标 准 的 浙 近 分 布 ， 在 上 述 两 种 情形 下 ， 都 是 用 模拟 方法 来 得 到 检验 统计 量 的 临界 值 ， 
部 分 临界 值 可 参见 Fuller(1976, 第 8 Æ). PAM. WR & AO 且 使 用 的 是 式 (2-40)， 则 用 来 检验 
册 二 1 的 上 比 是 源 近 正 态 的 ， 但 这 需要 很 大 的 样本 容量 来 保证 渐 近 正 态 分 布 的 成 立 , 

对 许多 经 济 时 间 序 列 而 言 ，ARIMA(p，d，9g) 可 能 比 式 (2-40) 给 出 的 简单 模型 更 适合 . 
在 计量 经 济 学 文献 中 ， 经 笛 使 用 的 是 ARC) REAL. H zx, 表示 该 序列 ， 为 了 验证 在 AR(p) 过 
程 中 是 否 存 在 单位 根 ， 可 以 通过 下 列 回归 来 检验 原 假设 Ho p51 和 备 择 假设 Hi :8<1 


一 Cr = X Atn E (2-41) 


其 中 Cy 是 天 于 时 间 指 标 t 的 确定 性 函数 ， AGS eE Lı 的 差分 序列 . 在 实际 中 ， Cy 
Wea, KEE MA Ha Fait. 6 一 1 AY ¢ LEA 


ADF 检验 = 



































in _ 

TISE 

其 中 6 为 8 的 最 小 二 乘 佑 计 ， 上 述 t 比 就 是 著名 的 扩展 DF 单位 根 (Augmented Dickey-Fuller, 
ADF) 检 验 ， 注意 ， 由 于 一 阶 差分 ， 式 (2-41) 等 价 于 一 个 带 确定 性 函数 c 的 AR(p) 模 型 . 
式 (2-41) 还 可 以 改写 为 





AD, G a eae 十 >» thes a €; 
HH, B=B—-1. 我们 可 以 等 价 地 检验 原 假设 A 3B =0 对 H, 8<. 


k #2 ğ 





例 2.4 考虑 美国 从 1947 年 第 1 季度 到 2008 年 第 4 EEEE GDP 对 数 序列 .该 序 
列表 现 出 上 升 趋势 ， 这 表明 天国 经 济 的 增长 ， 同 时 它 呈 现 高 度 的 样本 序列 相关 性 ， 参 见 
图 2-17 的 左 侧 下 方 图 形 ， 该 序列 的 1 阶 差 分 序列 代表 了 美国 GDP 的 增长 率 ， 图 2-17c 给 出 
了 差分 序列 的 时 序 图 ， 该 差分 序列 看 起 来 在 一 个 固定 的 均值 水 平 附近 波动 ， 尽管 在 最 近 几 
年 这 种 波动 性 比较 小 ， 为 了 证 实 所 观察 到 的 现象 ， 我 们 对 该 对 数 序列 进行 扩展 的 Dickey- 
Fuller 单位 根 检验 .基于 图 2-17 给 出 的 差分 序列 的 样本 PACF， 我 们 选择 p= 10. 我们 还 
选用 了 一 些 其 他 的 p WE. 然而 都 没有 改变 检验 的 结论 。 当 p=10 时 ，ADF 检验 统计 量 
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是 一 1. 611，p 值 是 0. 457， 这 表明 单位 根 假设 不 能 被 拒绝 . E 
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1950 1960 1970 1980 1990 2000 2010 1950 1960 1970 1980 1990 2000 2010 





Year Year 
a) 对 数 GDP 序 列 的 时 序 图 c) 对 数 GDP 序 列 的 样本 ACF 
Series : gdp Series : diff(gdp) 
ake 
UL, < 
U T A 
T ES 
Ps 
5 
i 
Lag i Lag 
b) 一 阶 差分 序列 的 时 序 图 d) 差分 序列 的 样本 PACF 
图 2-17 美国 从 1947 年 第 1 季度 到 2008 年 第 4 季度 的 季度 GDP 对 数 序 列 


R 代码 演示 

library (fUnitRoots) 
da-read.table("q-gdp4708.txt",header=T} 
gqdp=log(da[,4]) 

ml=ar (diff (gdp) ,method='mle’) 

> misSorder 

[1] 10 

> adfTest (qdp, lags=10,type=c("c")) 

Title: 

Augmented Dickey--Fuller Test 


MOM M s¥ 


Test Results: 
PARAMETER: 
Lag Order: 10 
STATISTIC: 
Dickey-Fuller: -1.6109 
P-VALUE: 0.4569 
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另外 一 个 例子 ， 考 虑 标 普 500(S&P500) 指 数 从 1950 年 1 月 3 日 到 2008 年 4 月 16 日 的 
日 对 数 收 益 率 序列 ， 共 有 14 462 个 观测 值 ， 图 2-18 给 出 了 该 序列 的 时 序 图 如果 想 从 实证 
的 角度 去 验证 该 指数 是 否 服从 带 漂 移 的 随机 游 动 ， 那 么 就 有 必要 检验 该 指数 序列 是 否 有 单 
MIR. 为 此 ， 应 用 扩展 的 Dickey-Fuller 检验 时 ， 我 们 采用 6c 王 ww 十 wt， 而且， 基于 一 阶 差 
分 序列 的 样本 PACF， 我 们 选择 p=15. 检验 统计 量 的 值 为 一 1. 995，p 值 为 0.581. 因此 ， 
在 任何 合理 的 显著 性 水 平 下 ， 单 位 根 的 原 假设 都 不 能 被 拒绝 . 进一步 的 分 析 表 明 ， 和 常数 项 
是 统计 显著 的 ， 尽 管 对 时 间 趋 势 的 估计 不 是 在 通常 的 5% 的 显著 性 水 平 下 ， 综 上 所 述 ， 从 
1950 年 1 月 到 2008 年 4 月 ， 标 普 500 指数 的 对 数 序 列 包含 一 个 单位 根 和 一 个 正 的 漂移 项 ， 
但 是 没有 很 强 的 证 据 表 明 该 序列 有 时 间 趋 势 . 
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1950 1960 1970 1980 1990 2000 2010 
Year 


图 2-18 标 善 500 指数 从 1950 年 1 月 3 日 到 2008 年 4 月 16 日 的 对 数 日 收益 率 的 时 序 图 


R 代码 演示 
> library (fUnitRoots) 
> da=read.table("d-sp55008.txt",header=T) 
> spS=log(da[,7]) 
> m2=ar (diff (sp5) ,method='mle’) % Based on AIC 
> m2zsorder 
[1] 2 
> adfTest (sp5, lags=2,type=("ct")) 
Title: 
Augmented Dickey-Fuller Test 


Test Results: 
PARAMETER: 
Lag Order: 2 
STATISTIC: 
Dickey-Fuller: -2.0179 
P-VALUE: 0.5708 
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> adfTest (sp5,lags=15,type=("ct")) $ Based on PACF 
Title: 
Augmented Dickey-Fuller Test 


Test Results: 
PARAMETER : 
Lag Order: 15 
STATISTIC: 
Dickey-Fuller: -1.9946 
P-VALUE: 0.5807 


> dsp5S=diff(sp5) 

> tdx=c(1:length(dsp5) ) 

> m3=arima(dsp5, order=c(2,0,0),xreg=tdx) 

> m3 

Call: arima(x = dsp5,order=c(2,0,0),xreg = tdx) 
Coefficients: 


arl ar2 intercept tdx 
0.0721 -0.0387 4e-O4 0 
s.e. 0.0083 0.0083 Ze-04 0 


Sigma*2 estimated as 8.1le-05:log likelihood=48287,aic=-96564 
> maScoef 
arl ar2 intercept tdx 
7.214122e-02 -3.868823e-02 3.513995e-04 -7.165372e-09 
> sqrt (diag (m3Svar.coef) ) 
arl ar? intercept tdx 
8.307510e-03 8.285669e-03 1.537309e-04 8.349685e-06 
> tratio=m3$coef/sgqrt (diag (m3$var.coef) ) 
> tratio 
arl ar2 intercept tdx 
8.6838549 -4.6692947 2.2858091 -0.0008582 


2.8 JEA FGR 


H P AA HE A i BOP TAI. BT Ae PT Td eS) oe, 的 超前 工 步 预测 ， 假设 预测 原 
meh, 所 有 历史 数据 是 可 知 的 .不 失 一 般 性 ， 我 们 假设 时 间 序 列 x 的 序列 相关 性 以 指数 
慷 减 ， 用 历史 数据 的 加 权 平 均 来 预测 x+;， 且 权重 的 页 献 是 指数 惨 减 的 .我 们 引入 一 个 
数 ， 使 得 


Lib OS WT p i ee > tas 
其 中 忆 是 (0，1) 上 的 一 个 正 实数 ， 称 为 贴现 因子 (discounting rate). AM, BUNA x 
的 范围 ， 我 们 有 必要 假设 权重 之 和 为 1， 利 用 几何 序列 的 性 质 ， 很 容易 发 现 Dw 一 [一 一， 


因此 ， 一 种 更 合适 的 加 权 平 均 的 方式 为 : 
il) = A-w) (ur, Hw tri Hwt +e] (2-42) 
这 种 预测 方法 叫做 指数 平滑 法 (exponential smoothing method). 应 用 这 种 方法 ， 数 据 越 新 
对 预测 zi 的 影响 就 越 大 ， 所 以 它 在 实际 中 的 应 用 很 广泛 . 
实际 上 ， 指 效 平 请 法 是 ARIMA 模型 的 特殊 情形 ， 考 愿 ARIMA(40，1，1) 模 型 : 
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(1—B)z, = (—6B)a, 
其 中 0E (0,，1). A 2.6.5 WH AR 模型 的 表示 方式 ， 该 模型 表明 
Xi = (1 —0 r,t r,t rs | 二 Tan 
因此 ， 超 前 1 步 预测 是 
a) = A — Olor, +P a4 十 Hz te] 
A 9 二 w， 就 恰好 得 到 式 (2-42) 所 给 出 的 指数 平滑 法 . 

把 指数 平滑 法 看 成 是 ARIMA(0，1，1) 模 型 的 特殊 情形 有 很 多 优点 ， 首先， 贴现 因子 
0 可 以 用 最 大 似 然 法 估计 出 来 ; 其 次 ， 可 以 用 ARIMA 模型 的 建 模 过 程 来 识别 和 检验 指数 
平滑 法 的 充分 性 . 

例 2.5 考虑 芝加哥 期 权 交 易 所 (CBOE) 从 2008 4F 5 A 1 A # 2010 4F 4 H 19 AY 
VIX 数据 ， 数 据 来 源 于 CBOE 网 站 . 图 2-19 是 对 数 VIX 指数 的 时 序 图 和 对 数 VIX 差分 序 
列 的 样本 ACF. 在 5% 的 水 平 下 ， 只 有 1 Brittle ACF 显著 不 等 于 0， 因此 可 以 为 该 差分 序 
列 建立 MACD, A x, 二 In(VIX,)， 拟 合 的 模型 为 . 

(1—B)x, =A o 163B)a,, 72 一 0.0044 
残 差 的 Ljung-Box 统计 量 表 明 拟 合 的 ARIMA(0，1，1) 模 型 是 充分 的 . 比如， 对 于 自由 度 
为 9 的 xX 分 布 来 说 ， 我 们 有 Q(10)=14.25，p=0.11 时 ， 因 此 ， 在 本 例 中 ， 我 们 可 以 用 
指数 平滑 法 来 预测 日 VIX 指数 的 对 数 序列 . m 

















In {vix} 
3.0 3.5 4.0 





2008.5 2009.0 2009.5 2010.0 
Year 
a) 对 数 VIX 的 时 序 图 
Series diff(vix) 


ACF 
04 0.8 





0.0 


=- = 一 =e m m o o e O ZF Fs 本 | ese Fs sss Ss Pe Pe Ee Se mm e =æ m = e e a ee e e 


Lag 
b) 对 数 VIX 序 列 的 差分 序列 样本 ACEF 
图 2-19 艺 加 哥 期 权 交易 所 从 2008 4E 5 A 1 AS 2010 4 4 A 19 HAYA VIX 指数 的 对 数 序列 
R 代码 演示 


> da=read.table("d-vix0810.txt",header=T] 
> vix=log(da$Close) 


94 


96 


97 | 





98 | 
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> length (vix) 

[1] 496 

> ml=arima(vix, order=c(0,1,1)) 

> mil 

Call: 

arima(x = vix, order = c{0, 1, 1)) 


Coefficients: 
mal 

-0.1629 

s.e, 0.0497 


Sigma"“2 estimated as 0.004429: log likelihood=638.97, aic=-1273.94 
> 
> Box.test (ml$residuals, lag=10, type='Ljung’' ) 

Box-Ljung test 


data: mlSresiduals 
X-squared = 14.2536, df = 10, p-value = 0.1617 


> pp=1-pchisq(14.25, 9) 
> pp 


[1] 0.1137060 
最 后 ， 本 市 的 方法 可 以 进行 推广 ， 可 以 证 明 双 指数 平滑 预测 分 析 方 法 是 ARIMACO, 1, 1) 
模型 的 一 个 特例 。 


2.9 季节 模型 


有 些 金 融 时 间 序 列 ， 如 公司 股票 的 每 股 季 度 鱼 利 ， 呈 现 出 一 定 的 循环 或 周期 性 .这 
样 的 时 间 序 列 叫 做 季节 时 间 序 列 (seasonal time series). 回顾 图 2-2 所 示 的 可 口 可 乐 公司 
股票 从 1983 年 第 1 季度 到 2009 年 第 3 季度 的 每 股 季 度 鳃 利 时 序 图 . 图 2-2 中 有 明显 的 
季节 性 ， 仔 细 检 查 该 时 序 图 ， 可 以 看 到 该 季度 便利 数据 有 很 强 的 季节 性 ， 在 样本 周期 内 
AAR TREE FT; Ah. AAE 20 世纪 90 年 代 末 期 有 一 些 波 动 . 上 述 的 季 世 模式 每 年 
重复 一 次 ， 从 而 该 序列 的 周期 是 4. 如 采 我 们 考虑 月 数据 (如 Wal-Mart 商店 的 月 销售 
a). We] xe 12. 

FER RATA KY AE mE A REH he ET TBD AY SE EE. ET T E Jae AR A 
也 是 有 用 的 . DR JAA. ARRIA OR AY EY Ta] Ae A as 7 ER BS) = HE. 

季节 时 间 序 列 的 分 析 已 有 很 长 的 历史 .在 有 些 应 用 中 ， 季 节 人 性 的 重要 性 是 次 要 的 ， 可 
以 把 它 从 数据 中 移 除 ， 得 到 经 季 闻 调整 后 的 时 间 序 列 ， 然 后 再 用 来 做 推 朵 ,从 时 间 序 列 中 
移 除 季节 性 的 过 程 叫做 季节 调整 (seasonal adjustment). 有 多 种 季节 调整 的 方法 ， 例 如 
Pena 等 (2001， 第 8 章 ) 以 及 它 的 引用 文献 . 美国 政府 公布 的 大 多 数 经 济 数据 是 经 季节 调整 
的 (如 GDP ŽRK AMK). 在 另 一 些 应 用 中 ， 如 进行 预测 时 ， 数 据 的 季节 性 和 其 他 特征 
一 样 重要 ， 必 须 进 行 相应 的 处 理 . 因为 预测 是 金融 时 间 序 列 分 析 的 一 个 主要 目的 ， 所 以 我 
{a FE TB Be oy Or ET Te Ae. 我 们 的 目的 是 讨论 一 些 在 季 市 时 间 序 列 建 模 中 有 用 的 计 
量 经 济 模 型 和 方法 . 
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2.9.1 季节 差分 


图 2-20 所 示 的 是 可 口 可 乐 公司 的 每 股 股票 对 数 稳 利 的 时 序 图 . 这 里 进行 对 数 变 换 有 两 
个 原因 : 一 是 处 理 序 列 的 指数 增长 . 事实 上， 该 时 序 图 证 实 了 取 对 数 后 的 序列 的 确 是 线性 增 
长 的 ， 这 个 线性 增长 趋势 甚至 在 1998 年 的 波动 后 仍然 以 不 同 的 速率 持续 ， 二 是 对 数 变 换 可 用 
来 稳定 序列 的 波动 性 .和 图 2-2 比较 ， 图 2-2 中 的 原始 季度 盘 利 序列 有 波动 性 增加 的 趋势 ， 而 
在 对 数 变 换 后 序列 的 时 序 图 中 ， 这 种 增加 趋势 束 消 失 了 .事实 上 ， 对 数 变换 在 金融 、 经 济 时 
间 序 列 分 析 中 是 第 用 的 .在 这 个 具体 例子 中 ， 因 为 盘 利 是 正 的 ， 所 以 在 变换 之 前 不 需要 做 调 
整 ， 而 在 有 些 情 况 下 ， 我 们 需要 对 每 个 数据 点 加 上 一 个 正常 数 后 再 做 对 数 变 换 . 
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图 2-20 可 口 可 乐 公 司 股票 从 1983 年 1 季度 到 2009 年 3 EE BE iE E X A a A ET Kl 











SO BUA AA x. 图 2-21a 是 zx, 的 样本 上 自 相关 函数 图 ， 它 表明 每 股 季 度 对 数 生 利 具 有 
强 的 前 后 相关 性 . 处理 序 列强 前 后 相关 性 的 一 个 惯用 方法 是 考虑 zx, 的 一 阶 差分 序列 ( 即 
AXx: 王 Xx: 一 Xi-1 一 《1 一 B)z:)， 在 时 间 序 列 分 析 中 ， 通 过 差分 来 得 到 平稳 性 是 一 种 惯用 手法 . 
图 2-22a 是 Ax, 的 时 序 图 ， 从 图 2-22a 中 可 知 : 1) 通 过 差分 ， 成 功 地 移 除 了 数据 的 向 上 趋 
势 ;2) 差 分 后 序列 显示 很 强 的 季节 性 .图 2-21c 给 出 了 Az, REA BK. FT 
涡 后 阶 数 是 周期 4 的 倍数 时 自 相 关 函 数 较 大 .为 处 ， 这 种 季 市 样本 自 相 关 孔 数 慢 慢 衰 减 . 
这 里 我 们 观测 到 了 季 廊 时 间 序 列 的 样本 自 相 关 函 数 的 典型 表现 .按照 Box (1994, $ 9 
章 ) 的 内 容 ， 我 们 对 Aa, 做 季节 差分 来 处 理 强 季节 模式 .具体 地 ， 考 虑 

ACA) = (1 — BY) Ax, = Az; — Aten = £, — L Xs r,s 
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运算 A= B 叫做 季节 差分 (seasonal differencing). 一 般 地 ， 对 一 个 周期 为 ; HETH 
HFJ y,， 季 市 差分 意 指 





A,y， 一 Yes 一 Ql =b y; 
FE 22) TE A ML A eS IL. AW, ERE RS a] AY RE ZED r PR IE ARP 
叫做 正规 差分 (regular differencing). 
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图 2-21 ”可口可乐 公司 股票 从 1983 年 第 1 季度 到 2009 年 第 3 季度 每 股 季度 盈利 的 对 数 序列 的 样本 自 相 
关 函 数 图 ， 其 中 “koeps” 是 对 数 一 利 ，“deps” 是 一 阶 差分 序列 ,，“sdeps” 是 季节 差分 序列 ， 
“ddeps” 表 示 正 规 差分 和 季 市 差分 后 的 序列 

图 2-22c 给 出 了 AsAz 的 时 序 图 .从 图 2-22c Pay UL, 序列 Az, 的 强 季 节 性 消失 了 . 

图 2-21d 给 出 了 A Az, 的 样本 自 相 关 函 数 ACF 图 ， 从 该 ACF 图 可 以 看 出 : 

1) 自 相 关 函 数 在 滞后 阶 数 为 1 和 4 时 统计 显著 且 为 负 值 ， 也 就 是 说 ， 序 列 在 常规 渍 后 

AE 1 Hit ae EY BAK ABA Ie] OO W. 

2) EM a Tae 5 时 ACF 为 正 旦 统计 显著 . 

3) 在 滞后 阶 数 为 3 时 ACF 为 正 且 略微 统计 显著 . 

观测 到 的 这 些 现象 在 实证 季 市 时 间 序 列 中 是 常见 的 ， 这 导致 了 下 一 市 要 介绍 的 多 重 季 
PRAWA. 为 了 完整 性 ， 图 2-21 还 给 出 了 季节 差分 序列 Aiz WER HHR ew A. 
图 2-22b 则 给 出 了 相应 的 时 序 图 . 
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2.9.2 多 


如 果 一 个 统计 模型 的 自 相 关 函 数 具 有 图 2-21 C1 — BY) (C1 B), 的 样本 ACF 的 表现 ， 
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a) 一 阶 差 分 序列 
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b 季节 差分 序列 
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cj) WAAR EASTA 
图 2-22 POA Rw) SM 1983 年 第 1 季度 到 2009 年 第 3 EE A EE Al 
的 对 数 序列 的 时 序 图 





重 季 节 模 型 





WW TA BRA BK Dy & BE ET A,B 


(l= 5) Cl) = Bx, = (Lb C — OB)a, 








(airline model), J, Box (1994, 第 9 Š). 





论 该 模型 的 MA 部 分 : 


ZU = CL—¢@B)CL= OB )a, = a, — Oa. — Oan, 00a, ,i 


Var(w,) = 1+6@)014+ 06 
Cov(w, ,w, 1) =— 014+ 0))¢ 


Cov (w, T ED. = 600. 


(2-43) 
其 中 s 是 序列 的 周期 ，w 是 白 噪声 序列 ，|0| 二 1，|8| 二 1， 此 模型 在 文献 中 称 为 航空 模型 
它 广泛 地 应 用 于 季节 时 间 序列 的 建 模 ， 此 模 
型 的 AR 部 分 由 正规 差分 和 季节 差分 两 部 分 组 成 ， 而 MA 部 分 包括 两 个 参数 ， 下 面 着 重 讨 
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AE ae 


/6 h LE 





Cov(w,, we.) =— @1+ 6a; 
Cov(w,,w, ,1) = 09c: 
Covlw, sw) = 0, 其 中 bY 关 0,1,s 一 1,s,s 十 1 
Ali. FA] w, 的 ACF 为 


_ -8 _ -@ 09 
OT Tt? OT ee? Ort Bt Ps OY @®) 


Xf 2>0 H. #1, s—1, s, stl, Ap =0. PM, WAR w 是 季度 时 间 序 列 ， 那 么 s=4 且 
ER ACF 只 在 清 后 阶 数 为 1、3、4、5 时 非 零 . 事实 上 ， 这 就 是 可 口 可 乐 公司 股票 季度 对 
数 盘 利 序列 的 情况 . 

把 上 述 ACF 与 MA(1) 模 型 y, 一 (1 一 9B)a, 和 MACs) BE AY z, = (1— @B')a, 的 ACF 相 
比较 ， 会 看 到 有 意思 的 结论 . ww Me, 序列 的 ACF 分 别 是 


p(y) = TF to ， Lol 














二 Holz) =0, €>0, /A 

我 们 看 到 : Do=as 2o50); 3o- =p 50W Xp). KI, ÆJ] w, 在 
Hi a AN s —1 和 s 十 1 时 ACF H AA N Ei a AA 1 和 间隔 为 的 序列 相关 性 的 交互 
作用 (interaction) 的 结果 . w, 的 模型 称 为 多 重 (multiplicative) 季节 MA 模型 . 在 实际 中 ， 
多 重 季 节 模 型 意味 着 序列 的 正规 部 分 与 季节 部 分 的 动态 结构 是 近似 正 交 的 . 

为 说 明 航 空 模 型 的 有 用 性 ， 重 新 改写 式 (2-43) 所 表示 的 航空 模型 为 下 式 : 

I = ( | 等 和 
1 268 = GB 
i y= U1—-B)/A—-©B')z,, HAA 
(l= B)» =] CU—@Boa. (= B a = (1-05 )y 

这 里 ，y, 是 2.8 节 中 的 指数 平滑 模型 ， 而 x, 为 男 一 个 带 有 季节 成 分 的 指数 平滑 模型 .所 
以 ， 航 空 模型 可 以 认为 是 作用 于 男 一 个 指数 平滑 模型 的 指数 平滑 模型 .其 中 的 一 个 指数 平 
清 用 于 通 各 的 序列 相关 性 ， 而 另 一 个 指数 平滑 用 于 季节 相关 性 . 

例 2.6 在 本 例 中 ,我 们 把 航空 模型 应 用 到 可 口 可 乐 公 司 股票 从 1983 年 1 季度 到 2009 
年 3 季度 每 股 季度 盈利 的 对 数 序列 .基于 精确 似 然 法 所 拟 合 的 模型 为 

(1—B)(1— B')z, = (1 — 0. 4096B) (1 — 0. 8203B')a,, 62= 0.007 24 

其 中 两 个 MA 参数 的 标准 误差 分 别 为 0.0866 和 0.0743, 5 HWY Ljung-Box 统计 量 为 
Q(12) 二 13.2， 当 自由 度 为 12 时 ， 其 p 值 为 0.35.， 当 调整 自由 度 为 10 时 ， 相 应 的 p 值 为 
0.21. 图 2-23 给 出 了 拟 合 的 航空 模型 的 诊断 图 ， 图 2-23a 是 标准 化 残 差 ， 该 图 可 以 用 于 检 
查 残 差 的 iid 假设 ， 并 找 出 数据 中 可 能 存在 的 异常 值 . 图 2-23b 给 出 了 和 残 差 的 ACEF Kl. H 
想 情 况 下 ， 所 有 的 残 差 ACK 应 该 在 两 倍 的 标准 误差 上 下 限 内 .图 2-23c h SILT A IA] m 
值 对 应 的 Ljung-Box 统计 量 的 pb 值 . 如 果 拟 合 的 模型 能 充分 描述 数据 中 的 序列 相关 性 ， 那 


p(z) = 
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么 所 有 这 些 p 值 应 该 大 于 第 1 类 错误 值 ， 图 2-23 中 的 虚线 给 出 了 默认 的 第 工 类 错误 值 
0.05. m 的 具体 数值 可 以 通过 命令 tsdiag 的 子 命令 gof 来 指定 . 基于 图 2-23 给 出 的 3 幅 
图 形 ， 除 了 在 1999 年 年 末 可 能 有 异常 值 外 ， 模 型 看 起 来 充分 拟 合 了 可 口 可 乐 公司 股 票 的 季 
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a) 残 差 序列 时 序 图 
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Lag 
b) 标准 化 残 差 序列 的 ACF 图 
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c) 标准 化 残 差 序列 的 Ljung-Box 统 计量 的 p 值 图 





图 2-23 可口 可 乐 公司 股票 从 1983 年 第 1 季度 到 2009 年 第 3 季度 每 股 季度 一 利 对 数 
序列 的 拟 合 的 航空 模型 诊断 图 

为 了 说 明 上 述 拟 合 的 季节 模型 的 预测 性 能 ， 我 们 利用 前 100 个 观测 值 ， 即 从 1983 年 到 
2007 年 的 数据 ， 重 新 估计 模型 的 参数 ， 而 把 最 后 7 个 数据 点 用 来 进行 预测 评价 ， 重新 拟 合 
的 模型 为 :; (1—B)(1—B')z,=(1—0. 4209B) (1—0. 8099B')a,, 62=0.007 43, LhLhA=100 
为 预测 原点 ， 计 算 超 前 1 一 7” 步 预测 值 和 它们 的 标准 误差 . TR SA AY ON L.A 
用 第 1 章 中 给 出 的 正 态 分 布 与 对 数 正 态 分 布 之 间 的 关系 ， 先 进行 反对 数 变 换 . 图 2-24 给 出 
了 模型 的 预测 表现 ， 其 中 实 线 表示 原始 序列 数据 ， 预 测 期 的 真实 观测 值 用 %o” 标 识 ， 点 预 
测 值 用 “x ”标识 .虚线 表示 95% 的 区 间 预 测 . 从 图 2-24 中 可 看 出 ， 预 测 显 示 出 强烈 的 季节 
性 ， 并 与 实际 观测 值 相近 .真实 的 鳃 利 都 位 于 区 间 预 测 内 . 
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图 2-24 AY BY RA wl CS A BE ASP DV] FN. 预测 原点 为 2007 年 ， 预 
MH A) EL SL (EL A“ o” td. A OUI EL PRR, ERRI 95% 的 区 间 预 测 


R 代码 演示 
> da=read.table("q-ko-earns8309.txt",header=T} 
> head(da) 


pends anntime value 
1 19830331 19830426 0.0375 


6 19840630 19840720 0.0583 

> eps=log(da$value) 

> koeps=ts(eps, frequency=4,start=c(1983,1)) 
> plot (koeps, type='1') 

> points (koeps, pch=cl,cex=0.6) 
% Obtain ACF plot 

> par (mficol=c(2,2)) 

> koeps=log(daSvalue) 

> deps=diff(koeps) 

> sdeps=diff(koeps, 4) 

> ddeps=diff(sdeps) 

> acf (koeps, lag=20) 

> acf (deps, lag=20) 

> acf (sdeps, lag=20) 

> acf(ddeps, lag=20) 

% Obtain time plots 
人 

e Zee 6"19 742", &3%, a 

> par(mfcol=c(3,1)) 
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plot (deps,xlab=‘year’,ylab='diff’,type='1’) 
points (deps, pch=cl,cex=0.7) 
plot (sdeps, xlab='year’ ,ylab=’sea-diff’,type='1’) 
points (sdeps, pch=c2,cex=0.7) 
plot (ddeps, xlab=‘year’ ,ylab='dd’ ,type='1’) 
points (ddeps, pch=cl,cex=0.7) 
Estimation 
ml=arima(koeps, order=c(0,1,1),seasonal=list (order=c(0,1,1),period=4) } 
ml 
Call: 
arima(x=koeps, order=c(0,1,1),seasonal=list (order=c(0,1,1),period=4) ) 
Coefficients: 
mal smal 
-0.4096 -0.8203 
s.e. 0.0866 0.0743 


T WR VOM N YN 


sigma^2 estimated as 0.00724: log likelihood = 104.25, aic = -202.5 


> tsdiag(m1,gof=20) % model checking 
> Box.test (ml$residuals, lag=12,type=’Ljung’ ) 
Box-Ljung test 
data: mlS$residuals 
X-squared = 13.3034, df = 12, p-value = 0.3474 
> pp=1-pchisq(13.30,10) 
> Pp 
[1] 0.2073788 % p-value 
% Out-of-sample forecasting 
> koeps=log(da$value) 
> length(koeps) 
{1} 107 
> y=koeps[1:100] 
> ml=arima(y,order=c(0,1,1),seasonal=list (order=c(0,1,1),period=4) ) 
> ml 
Coefficients: 
mal smal 
-0.4209 -0.8099 
s.e. 0.0874 0.0767 


sigma*2 estimated as 0.007432: log likelihood = 95.78, aic = -185.57 
$ Prediction 

> pml=predict (ml,7) 

> names (pm1) 

[1] "pred" "se" 

> pred=pmlSpred 

se=pmlSse 

Anti-log transformation 
ko=daSvalue 

fore=exp (pred+se*2/2) 

vil=exp (2*pred+se*2)* (exp(se*2)-1]) 
sl=sqrt (v1) 

eps=ko[80:107] 

> length (eps) 

[1] 28 

> tdx=(c(1:28)+3) /4+2002 

> upp=c(ko[(100],fore+2*s1) 

> low=c(ko[100], fore-2*s1) 
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> min (low, eps) 

Li 033 

> max (upp, eps) 

[1] 1.267623 

> plot (tdx, eps,xlab='year',ylab='earnings' ,type='1',ylim=c(0.35,1.3):; 
points (tdx(22:28],fore,pch='*’) 

lines (tdx[(21:28) , upp, lty=2) 

lines (tdx[21:28], low, lty=2) 

points (tdx[22:28],ko[101:107],pch='0’ ,cex=0.7) 


在 某 些 应 用 中 ， 需 要 应 用 如 下 的 多 重 季 节 模 型 : 
(1 一 了 B)(1 一 Bi = A-¢6,B-6,B°)1 — OB’ )a, 
特别 是 ， 当 六 4 时 ， 这 里 ， 差 分 序列 w= 二 (1 一 B)(1 一 B')zx, 的 ACE 可 能 在 清 后 阶 数 为 1、 
2. s~2, s~ly s, sv l 和 s 十 2 WARS. w, 的 样本 ACF 可 以 用 来 识别 这 样 的 模型 . 
模型 


WM: YN 





O (CI le ES oe (2-44) 
HR, [0| <1 和 |16| 过 1， 是 一 个 非 乘 积 季 节 MA 模型 . 显而易见 ， 在 式 (2-44) 的 模型 中 
有 po 王 0， 乘 积 模型 比 对 应 的 非 乘积 模型 更 节省 ， 因 为 虽然 两 个 模型 都 用 了 相同 数目 的 参 
数 ， 但 是 乘积 模型 有 更 多 非 零 的 ACF. 


2.9.3 PMSS 








当 一 个 时 间 序 列 的 季节 模式 是 随时 间 稳 定 ( 即 ， 近 似 于 确定 性 函数 ) 时 ， 可 用 哑 变 量 
(dummy variable) RARE EPI. 这 里 所 谓 的 季节 哑 变 量 ， 是 指 用 指示 变量 来 代表 一 年 中 
的 各 个 季 市 .对 于 季度 数据 ， 哑 变量 分 别 代表 春季 、 夏 季 、 秋 季 和 人 冬季， 其 中 的 3 个 哑 变 
量 将 用 于 分 析 中 . 许多 分 析 师 采用 这 种 分 析 方 法 . 然而 ， 确 定性 的 季节 只 是 前 面 讨论 的 多 重 
季节 模型 的 一 个 特殊 情形 .特别 地 ， 如 果 O=1 时 ， 模 型 ( 式 (2-43)) 包 含 一 个 确定 性 的 季节 
成 分 . 因此 ， 当 季 闻 模式 是 确定 性 时 ， 用 哑 变 量 或 者 多 重 季 区 模 型 都 能 得 到 相同 的 预测 续 
Ae. 但 是 ， 当 季 市 模式 不 是 确定 性 的 时 候 ， 哑 变量 方法 会 导致 较 差 的 预测 .在 实际 中 ， 我 
们 建议 用 精确 似 然 法 去 估计 一 个 多 重 季 市 模型 ， 特 别 是 当 样 本 容量 较 小 或 可 能 存在 一 个 确 
定性 的 季节 成 分 时 . 

例 2.7 为 了 说 明确 定性 的 季 市 性 ， 考虑 CRSP 第 1 个 10 分 位 (市 值 最 大 的 公司 ) 指 数 
从 1970 年 1 月 到 2008 年 12 月 的 月 简单 收益 率 ， 共 有 468 个 观测 值 . 图 2-25a 给 出 了 序列 
的 时 序 图 ， 该 时 序 图 并 没有 显示 出 序列 有 明显 的 季 市 性 . 然而， 图 2-25b 给 出 的 样本 ACF 
fetta BTA 12, 24, 36 以 及 沛 后 阶 数 为 1 处 显著 不 为 零 ， 如 果 选 用 季 市 ARMA RA, 
则 模型 有 具有 以 下 形式 : 






































(1—¢,B)(1—$,B")X, 一 (一 0 有 )a， 
其 中 X, 表示 月 人 简单 收益 率 。 去除 不 显著 的 参数 后 ， 拟 合 的 模型 为 : 
Ci-0, 1798 Cl —=0,. 93908 ) = (Cl — 0.90138 Jas oa = 000472 
从 拟 合 的 模型 中 可 以 清楚 地 看 到 ， 季 AR 和 MA 因子 近乎 相互 抵消 .这 表明 精确 似 然 方 
法 应 用 的 有 效 性 ， 并 且 舍 计 的 绪 末 说 明 可 能 存在 确定 性 的 季 闻 性 .为 了 进一步 证 实 确定 性 
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lan, = l e 
lo 其 他 月 


并 应 用 简单 线性 回归 

X, = b +f Jan + e, 
拟 合 的 模型 为 X, = 0.0029 十 0.1253Jan, 十 e， 其 中 估计 的 标准 误差 分 别 为 0. 0033 和 
0.0115. 图 2-25a、b 分 别 给 出 了 上 述 简单 线性 回归 残 差 的 时 序 图 和 残 差 的 样本 ACF. 从 
样本 ACF 来 看 ， 在 涉 后 阶 数 为 12、24 和 36 处 的 序列 相关 性 大 大 消除 了 . 这 表明 通过 1 月 
Meer, 已 经 成 功 地 消除 了 第 1 个 10 分 位 收益 率 的 季 市 模式 .因此 ， 第 1 个 10 分 位 的 月 








简单 收益 率 的 季节 性 主要 是 由 于 工 月 效应 (January effect) 导致 的 . E 
十 
F = 
S ol 
oa a? 
E> To 
g o 
T T 
1970 1980 1990 2000 2010 1970 1980 1990 2000 2010 
Year Year 
a) 简单 收益 率 的 时 序 图 c) 调整 1 月 效应 后 的 简单 收益 率 的 时 序 图 


ACF 





Lag Lag 
b) 简单 收益 率 的 样本 ACF d) 调整 后 的 简单 收益 率 的 样本 ACF 


图 2-25 CRSP 第 1 个 10 分 位 指数 从 1970 年 1 月 到 2008 年 12 月 的 月 简单 收益 率 


R 代码 演示 (输出 经 过 编辑 , 名 表示 注解 ) 


da=read.table("m-deciles0O8.txt", header=T} 
di=da[,2] 

jan=rep(c(1,rep(0,11)),39) % Create January dummy. 
mli=Im(dl ~ jan) 

summary (ml) 

Im(formula = dl ~ jan) 
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Coefficients: 

Estimate Std. Error t value Pr (>|t|) 
(Intercept) 0.002864 0.003333 0.859 0.391 
jan 0.125251 0.011546 10.848 <2e-16 *** 
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Residual standard error: 0.06904 on 466 degrees of freedom 
Multiple R-squared: 0.2016, Adjusted R-squared: 0.1999 


> m2=arima(dl1,order=c(1,0,0),seasonal=list (order=c(1,0,1), 
+ period=12) ) 


> m2 
Coefficients: 
aril sarl smal intercept 
0.1769 0.9882 -0.9144 0.0118 % insignificant intercept 


s.e. 0.0456 0.0093 0.0335 0.0129 


sigma*2 estimated as 0.004717: log likelihood=584.07, aic=-1158.14 
> tsdiag(m2,gof=36) % plot not shown. 


> m2=arima(dl1,order=c(1,0,0),seasonal=list(order=c(1,0,1), 
+ period=12) , include.mean=F) 
> m2 


Call: 
arima(x=d1,order=c(1,0,0),seasonal=list (order=c(1,0,1),period=12), 
include,.mean = F) 


Coefficients: 
arl sarl smal 
0.1787 0.9886 -0.9127 % All estimates are significant. 
s.e. 0.0456 0.0089 0.0335 


sigma"2 estimated as 0.00472: log likelihood=583.68, aic=-1159.36 
2.10 AERA AY Bam a 


在 许多 应 用 中 ， 主 要 兴趣 在 于 两 个 时 间 序 列 的 关系 上 . 金融 中 的 市 场 模型 (Market 
Model) 显然 就 是 其 中 一 个 例子 ， 它 要 找 出 个 股 的 超额 收益 率 与 市 场 指数 收益 率 之 间 的 关 
A. 利率 的 期 限 结构 是 男 一 个 例子 ， 它 研究 的 是 不 同期 限 利率 之 间 的 关系 是 怎样 随时 间 演 
变 的 . 这 些 例子 导致 我 们 考虑 如 下 形式 的 线性 回归 : 

yı =a F pr: te (2-45) 
其 中 y, 和 x, 是 两 个 时 间 序 列 ，e 表示 误差 项 . 经 常用 最 小 二 乘 (LS) 法 来 估计 模型 
(s0(2-45)). Ale} AMSA. WM LS 给 出 的 估计 是 相合 的 ， 然而， 在 实际 中 经 党 遇 到 
误差 。 是 前 后 相关 的 情形 . 这 时 ， 模 型 ( 式 (2-45)) 就 是 一 个 带 时 间 序 列 误差 的 回归 模型 ， 
最 小 二 乘法 (LS) 所 产生 的 < 和 8 的 估计 可 能 是 不 相合 的 . 

带 时 间 序 列 误差 的 回归 模型 在 经 济 、 金 融 中 有 广泛 应 用 . 然而， 应 用 该 模型 必须 小 
D, PRAX e, 的 前 后 相关 性 .此 模型 值得 我 们 仔细 研究 . 

我 们 通过 考虑 如 下 两 个 美国 周 利 率 序 列 之 间 的 关系 来 介绍 该 模型 : 

D zu: 一 年 期 固定 期 限 国库 券 利率 . 

2) xa: 三 年 期 固定 期 限 国 库 券 利率 . 
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这 两 个 序列 都 是 以 百分数 给 出 ， 观 测 时 间 都 是 从 1962 年 1 月 5 日 至 2009 年 10 月 4 

日 ， 都 有 2467 个 观测 值 ， 数 据 是 从 圣路易斯 联邦 储备 银行 得 到 的 . 严格 地 讲 ， 应 该 利用 多 

元 时 间 序 列 分 析 对 这 两 个 利率 序列 联合 建 模 (Tsay，2010， 第 8 章 ). 然而 ， 为 了 人 简单 起 
见 ， 我 们 将 注意 力 放 在 回归 类 型 的 分 析 上 ， 并 且 忽 略 它 们 的 同时 性 . 

图 2-26 是 上 述 两 个 利率 序列 的 时 序 图 ， 实 线 是 一 年 期 的 利率 ， 虚 线 是 三 年 期 的 利 

X. 图 2-27a 是 和 zs 的 散 点 图 ， 正好 与 预期 的 一 样 ， 这 两 种 利率 是 高 度 相 关 的 . 描述 

这 两 种 利率 之 间 关 系 的 一 个 简单 方式 是 利用 简单 模型 x;, 二 a 十 Br 十 e， 所 拟 合 的 模型 是 

da m= eo 000 es Gc. = 0,520 (2-46) 
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图 2-26 从 1962 年 1 月 5 日 到 2009 年 4 月 10 日 图 2-27 从 1962 年 1 月 4 日 到 2009 年 4 月 10 日 
美国 周 利率 ( 百 分 比 ) 的 时 序 图 : 实 线 是 美国 周 利 率 的 散 点 图 
一 年 期 固定 期 限 国 债 利率， 虚线 是 三 年 
期 固定 期 限 国债 利率 
其 中 R* 二 96. 5%， 两 个 系数 的 标准 误差 分 别 为 0.024 和 0. 004. 模型 ( 式 (2-46)) 证 实 
了 两 种 利率 之 间 的 高 度 相关 性 . 然而， 由 图 2-28 所 示 的 该 模型 残 差 时 序 图 及 残 差 ACF 可 
见 ， 该 模型 是 严重 不 充分 的 ， 特别 地 ， 残 差 的 样本 ACF ERRERA., FFA TS eo. © 
示 出 单位 根 非 平稳 时 间 序 列 的 特点 .， 残 差 的 表现 说 明 两 种 利率 间 存 在 明显 的 差异 . 利用 现 
代 计 量 经 济 学 方法 ， 如 采 我 们 假定 两 个 利率 序列 都 是 单位 根 非 平稳 的 ， 那 么 式 (2-46) 中 残 
差 的 表现 说 明 这 两 种 利率 序列 不 是 协 整 的 (cointegrated)， 见 Tsay，(2010, 第 8 章 ) 关 于 协 
整 的 讨论 ). 换言之 ， 数 据 不 文 持 关于 两 种 利率 间 存 在 长 期 均衡 关系 的 假设 .从 某 种 意义 
上 讲 ， 这 不 意外 ， 因 为 “着 收益 曲线 ”(inverted yield curve) 在 数据 所 在 的 时 间 段 内 出 现 了 . 
“ 逆 收 益 曲 线 ” 指 的 是 利率 与 它们 离 到 期 日 的 时 间 长 短 逆 相关 . 
两 个 利率 序列 和 式 (2-46) 中 的 残 差 的 单位 根 表现 使 我 们 想到 考虑 利率 变化 量 序列 . 令 
1) cu 一 Xu 一 X11 一 (1 一 B)zxy，t 守 2; 一 年 期 利率 的 变化 量 . 
2) C =La ~ L31 = (1— B)ty, t22: 二 年 期 利率 的 变化 量 ， 
并 考虑 线性 回归 co =Beu Fe. 图 2-29 所 示 的 是 两 个 变化 量 序列 的 时 序 图 ， 而 图 2-27b 所 示 的 是 
它们 之 间 的 散 点 图 ， 这 两 个 变化 量 序列 仍然 是 高 度 相关 的 ， 对 它们 拟 合 的 线性 回归 模型 为 
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Residuals 
-0.5 


cy, = 0.792c, +e, ge = 0.0690 (2-47) 
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图 2-28 ”两 种 美国 周 利率 的 线性 回归 ( 式 (2-44)) 的 残 差 序列 
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b) 三 年 期 固定 期 限 国库 券 利 率 的 变化 
图 2-29 从 1962 年 1 月 12 日 到 1999 年 9 月 10 日 美国 周 利 率 变化 量 序 列 的 时 序 图 
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其 中 R =82.5%, 系数 的 标准 误差 是 0.0073， 此 模型 进一步 证 实 了 两 种 利率 间 很 强 的 线性 
相关 性 .图 2-30 给 出 了 式 (2-47) 残 差 的 时 友 图 和 样本 ACF. 该 样本 ACF 又 表明 残 差 中 有 
一 些 显 车 的 前 后 相关 性 ， 但 相关 系数 的 绝对 值 很 小 ， 残 差 的 这 种 弱 前 后 相关 性 能 用 前 面 儿 
方 中 讨 论 的 简单 时 间 序 列 模型 来 描述 ， 从 而 得 到 一 个 市 时 间 序 列 误 差 的 线性 回归 . 

这 一 市 的 主要 任务 是 讨论 用 一 个 简单 方法 来 建立 市 时 间 序 列 误差 的 线性 回归 模型 . 这 
种 方法 是 直接 的 . 我们 对 残 差 序列 选用 一 个 本 草 所 讨论 过 的 简单 时 间 序 列 模型 ， 然 后 联合 
估计 整个 模型 ,为 了 说 明 ， 考 虑 式 (2-47) 中 的 简单 线性 回归 . 因为 模型 的 残 差 是 前 后 相关 
的 ， 所 以 我 们 给 残 差 识别 一 个 简单 的 ARMA 模型 . 从 图 2-30 的 样本 ACF 看 出 ，MA(1) 
模型 对 残 差 序列 是 适合 的 ， 把 线性 回归 模型 修改 为 

Ca = Beu Fes e, = a, — ham (2-48) 

HHE (a, }7E—P AGRE. KA, RAT f A e H A ais iv A AS MA(1) 模 型 来 刻画 
式 (2-47) 中 误差 项 的 前 后 相关 性 .结果 得 到 的 模型 是 带 时 间 序 列 误 差 的 线性 回归 模型 的 简 
单 例子 .在 实际 应 用 中 ， 可 把 更 复杂 的 时 间 序 列 模型 加 到 线性 回归 方程 上 去 ， 形 成 通用 的 
带 时 间 序 列 误差 的 回归 模型 . 
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图 2-30 ”两 种 美国 周 利率 变化 的 线性 回归 ( 式 (2-45)) 的 残 差 序列 


在 现代 计算 机 出 现 之 前 ， 佑 计 带 时 间 序 列 误差 的 回归 模型 不 是 一 件 容 易 的 事 . 人 们 提 
出 一 些 特殊 的 方法 ， 如 Cochrane-Orcutt 佑 计量 ,来 处 理 残 差 中 的 前 后 相关 性 (Greene， 
2003， 第 273 W). 但 现在 这 种 估计 与 其 他 时 间 序 列 模型 的 估计 一 样 容易 ， 奉 所 用 的 时 间 序 
列 模型 是 平稳 的 、 可 道 的 ， 则 可 用 最 大 似 然 法 把 模型 一 起 估计 出 来 . 这 就 是 我 们 应 用 R 的 
命令 arima 时 所 应 用 的 方法 . 对 美国 的 周 利率 数据 ， 所 拟 合 的 模型 ( 式 (2-48)) 为 
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Cz, = 0.794c,, Fes e =a, +0.1823a,,,  & = 0.0678 (2-49) 

其 中 R* 二 83.1%， 参 数 的 标准 误差 分 别 为 0.0075 和 0. 0196， 此 模型 不 再 有 显著 的 滞后 阶 
BON 1 WR ACF, BREW aT BON 4. 6 和 7 时 残 差 有 较 小 的 前 后 自 相 关 性 ， 但 是 ， 
如 果 在 残 差 方程 中 加 上 清 后 阶 数 为 4、6 和 7 的 MA 系数 ， 结 果 改 进 并 不 大 ， 这 里 没有 给 
出 具体 结 

比较 式 (2-46) 、 式 (2-47) 和 式 (2-49) 这 三 个 模型 ， 我 们 观察 到 如 下 几 上 点: 第 一 ， 模 
型 ( 式 (2-46)) 的 高 R*(96.5%) 和 系数 (0.930) 导 致 人 们 的 错误 认识 ， 因 为 该 模型 的 残 差 有 
强烈 的 前 后 相关 性 .第 二 ， 对 于 利率 变化 量 序 列 ， 式 (2-47) 和 式 (2-49) 对 应 模型 的 R 和 cy 
的 系数 都 很 接近 . 这 说 明 对 这 个 具体 例子 来 说 ， 给 变化 量 序 列 加 上 一 个 MA(1) 模 型 所 得 到 
的 改进 不 大 ， 这 一 点 不 出 乎 意料 ， 因 为 佑 计 出 的 MA 系数 不 是 较 大 的 数值 ， 尽 管 它 是 高 度 
统计 显著 的 . 第 三 ， 上 述 分 析 表 明 在 线性 回归 分 析 中 检验 残 差 的 前 后 相关 性 是 很 重要 的 . 

从 陈 (2-49) ， 该 模型 表明 前 述 两 个 周 利率 序列 有 如 下 关系 : 

Ly = 23.4 T O | 0. 182a,, 

这 两 种 利率 是 相互 影响 并 前 后 相关 的 . 

R 代码 演示 (输出 经 过 编辑 ) 




















> rl=read.table("w-gslyr.txt",header=T)[,4] 
> r3=read.table("w-gs3yr.txt",header=T) [,4] 
> ml=lm(r3~r1) 

> summary (m1) 


Call: 
lm(formula = r3 ~ ri) 
Coefficients: 

Estimate Std. Error t value Pr (>|t|) 
(Intercept) 0.83214 0.02417 34.43 <2e-16 *** 
ei 0.92955 0.00357 260.40 <2e-16 *** 


Residual standard error: 0.5228 on 2465 degrees of freedom 
Multiple R-squared: 0.9649, Adjusted R-squared: 0.9649 


> plot (ml$residuals,type='1'’) 
> acf(mlSresiduals, lag=36) 
> cl=diff(r1) 
> c3=di ff (r3) 
> m2=lm(c3~-1+c1) 
> summary (m2) 
Call: 
lm(formula = c3 ~ -1 + cl) 
Coefficients: 
Estimate Std. Error t value Pr(>/t|) 
cl 0.791935 0.007337 107.9 <2e-16 *** 
Residual standard error: 0.06896 on 2465 degrees of freedom 
Multiple R-squared: 0.8253, Adjusted R-squared: 0.8253 


> acf(m2Sresiduals, lag=36) 


> m3=arima(c3,order=c(0,0,1),xreg=cl1, include.mean=F) 
> m3 
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Call: 
arima (x = c3, order = c(0, 0, 1), xreg = cl, include.mean = F) 
Coefficients: 


mal cl 
0.1823 0.7936 
s.e. 0.0196 0.0075 


Sigma*2 estimated as 0.0046: log likelihood=3136.62, aic=-6267.23 
> 


> rsq=(sum(c3%*2)-sum(m3$residuals%2) ) /sum(c3%2) 
> rsq 
[1] 0.8310077 


Ny efi 


我 们 给 出 分 析 训 时 间 序 列 误 差 的 线性 回归 模型 的 一 般 步 又 : 

D 拟 合 一 个 线性 回归 模型 并 检验 其 残 差 的 前 后 相关 性 . 

2) 如 末 残 差 序 列 是 单位 根 非 平稳 的 ， 则 对 因 变 量 和 解释 变量 都 做 一 阶 差分 .然后 对 两 
个 差分 后 的 序列 进行 第 1 步 . 在 这 时 的 残 差 序 列 是 平稳 的 ， 则 对 残 差 识别 一 个 ARMA 模 
型 并 相应 地 修改 线性 回归 模型 . 

3) 用 最 大 似 然 法 进行 联合 估计 ， 并 对 模型 进行 检验 ， 查 看 是 否 需 要 进一步 改进 . 

为 检验 残 差 的 前 后 相关 性 ， 我 们 推荐 使 用 Ljung-Box 统计 量 ， 而 不 使 用 Durbin-Wat- 
son(DW) 统 计量 ， 因 为 后 者 只 考虑 清 后 阶 数 为 1 的 前 后 相关 性 . 有 时 残 差 的 前 后 相关 性 表 
现在 高 阶 间 隔 上 ， 尤 其 是 在 所 涉及 的 时 间 序 列 呈 现 茶 种 季节 性 的 时 候 . 

注 记 : 设 有 残 差 序 列 e 的 工人 个 观察 值 ，Durbin-Watson 统计 量 是 


SD (e — en)’ 


DW= -= ~ 
De 
t=1 


直接 计算 表明 DW 人 2(1 一 01)， 其 中 pl 是 (e,) 的 滞后 阶 数 为 1 的 ACF. m 

注 记 : 在 一 些 应 用 中 ， 人 们 可 能 着 重 于 对 线性 回归 模型 做 出 推断 ， 而 不 是 直接 对 残 A 
序列 的 相关 性 结构 感 兴趣 . 这 时 候 ， 得 到 回归 系数 的 协 方 差 矩 阵 的 相合 估计 就 足够 了 .在 
出 现 相 关 性 和 条 件 异 方差 时 ， 文 献 中 有 多 个 方法 可 以 用 来 估计 回归 系数 的 协 方差 矩阵 . BR 
兴趣 的 读者 可 以 参阅 Tsay(2010，2. 10 ¥). 


2.11 长 记忆 模型 


我 们 已 经 讨论 过 ,平稳 序列 的 ACK 在 浏 后 阶 数 增加 时 呈 指 数 衰减 . 但 是 ， 对 单位 根 非 
平稳 时 间 序 列 ， 可 以 证 明 对 任意 固定 的 浪 后 阶 数 ， 当 样本 容量 增加 时 ， 样本 ACF Whe 1 
(Chan 和 Wei(1988); Tiao 和 Tsay(1983))， 另外 也 存在 一 些 时 间 序 列 ， 随 着 沛 后 阶 数 的 
增加 它们 的 ACF 以 多 项 式 的 速度 绥 慢 背 减 到 0. 这 些 时 间 序 列 称 为 长 记忆 时 间 序 列 (long- 
memory time series). 长 记忆 时 间 序 列 的 一 个 例子 就 是 如 下 定义 的 分 数 差 分 序列 : 

(JI= Br Sw =0 dx 0.5 (2-50) 
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FE = 


90 h 2P 

















其 中 {a, EA AEA. EA CGR (2-50) ) H PE GS FE OR P I EY R ( Hosking, 
1981). 我 们 把 它 的 一 些 性 质 概括 如 下 : 
1) Æ d<0.5, M x, 是 弱 平 稳 过 程 并 有 无 穷 阶 MA 表示 : 








Lı = a; E > film 
其 中 
_ dd+d)(k-1+d) _ R+d—1)! 
i F| L=] 
2) @d>—0.5, Wa, 是 可 逆 的 并 有 无 穷 阶 AR 表示 : 
Lı 一 六 mit i = ai 
其 中 


”一 d( Saree 1 
a Ba bi(—d—1)! 
3) 对 一 0. 5<d<0.5, x, 的 ACE 为 


_ 4) /DR meme, | >... 
Oe 1 — d) Q—d)(k— dd)’ = 


特别 地 ，o =d/1—d), H. kok} 
, (=a 
Cl) | 
4) *f—0.5<d<0.5, x, Wt BAAS PRL CPACF) H ¢,,=d/(k—d), k=1, 2, = 
5) 对 一 0. 5 二 d 二 0. 5， 作 为 x, 的 ACF 的 傅 里 叶 变 换 的 二 AT RE RE PRI fw). CWE 
fi) ~w l, w>0 (2-51) 





bn 





其 中 wE[0，2x] 表 示 频 率 . 
当 4 过 0.5 时 ,我们 对 xz, 的 ACF 的 性 质 特别 感 兴趣 . 这 个 性 质 表明 pi ~R “是 以 多 项 
式 速 度 衰减 ， 而 不 是 以 指数 速度 衰减 ， 正 因为 这 个 原因 ， 这 样 的 x, 过程 称 为 长 记忆 时 间 序 
列 。 式 (2-51) 中 的 谱 密 度 的 特殊 特征 是 ， 当 wo 0 时 谱 发 散 到 无 穷 . 然 而， 平稳 ARMA 过 
程 的 谱 密 度 函 数 对 所 有 we LO, 2n EA FE. 
前 面 我 们 用 到 了 非 整 数 震 的 二 项 式 定理 : 
JN T PT d d(d—1)(d—k+1 
Ta a Bt (jee 
若 分 数 差 分 序列 (1 一 B)“z, 服从 一 个 ARMACp, PRA, WRK x, 为 一 个 ARFIMA(D, d, 
9q) 过 程 ， 它 是 ARIMA 模型 的 推广 ， 这 里 允许 d HIERZ. 
在 实际 中 ， 如 果 一 个 时 间 序 列 的 样本 ACF 在 数值 上 不 大 ， 但 衰减 得 很 慢 ， 则 该 序列 可 
能 有 长 记忆 . 作为 说 明 ， 图 2-31 所 示 的 是 1970 年 1 月 2 日 至 2008 年 12 月 31 日 的 CRSP 
价值 加 权 指 数 和 等 权重 指数 的 日 简单 收益 率 的 绝对 值 序列 的 样本 ACF 值 ， 可 见 ACF 的 数 
值 相对 较 小 ， 但 衰减 得 很 慢 ， 甚 至 在 滞后 阶 数 为 300 之 后 还 是 在 5% 的 水 平 下 是 显著 的 . 
对 于 绝对 值 收 益 率 序列 的 样本 ACF 的 表现 ， 更 多 的 讨论 参见 Ding (1993). 对 式 (2-50) 
中 的 纯 分 数 差 分 模型 ， 我们 可 以 用 最 大 似 然 法 或 带 低 频 对 数 周期 图 的 回归 方法 来 估计 d. 
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可 以 人 参考， 例如 Geweke 和 Porter-Hudak(1982) A) T 4E. 


最 后 ， 长 记忆 模型 在 金融 文献 中 


受到 关注 ， 部 分 原因 是 由 于 在 连续 时 间 模 型 中 关于 分 形 布 上 朋 运 动 的 工作 . 


ACF of the absolute returns of value-weighted index 
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b) 等 权重 指数 收益 率 的 绝对 值 序列 的 ACE 
图 2-31 CRSP 价值 加 权 指 数 和 等 权重 指数 的 日 简单 收益 率 的 绝对 值 序列 的 样本 
ACEF， 样 本 周期 为 1970 年 1 月 2 日 到 2008 年 12 月 31 日 


例 2.8 为 了 说 明 长 记忆 时 间 序 列 的 建 模 ， 我 们 考虑 CRSP 价值 加 权 指 数 从 1970 年 1 H 
2 日 到 2008 年 12 月 31 日 的 绝对 日 收益 率 ， 图 2-31a 给 出 了 序列 的 样本 ACF 图 ， 把 该 序列 作 
为 纯 分 数 差 分 过 程 并 应 用 Geweke-Porter-Hudak 方法 , 我们 得 到 4 二 0.372,， 标准 误差 为 
0.070. 该 估计 值 的 确 在 平稳 和 可 逆 的 区 间 (0，0.5) 内 .， 如 果 我 们 应 用 AFRIMA(1，4，1) 模 
型 ， 并 应 用 最 大 似 然 佑 计 法 ， 我 们 得 到 拟 合 的 模型 为 
(1=0.113B)(1 = B) =y, = (1 = 0. 576B)a; 
其 中 y, 是 绝对 收益 ， 估 计 的 标准 误差 按照 出 现 顺序 分 别 为 0.006、0. 008 70 0.006. 这些 估 
计 是 高 度 显著 的 . 特别 地 ， 分 数 参 数 的 佑 计 接 近 非 平稳 的 边界 0.5.， 最 后 ， 可 以 应 用 R 的 
fracdiff 添加 包 来 估计 AFRIMA(p, d, QRA. 

R 代码 演示 





library (fracdiff) 
da-read.table("d-ibm3dx7008.txt",header=T) 
head (da) 

Date rtn vwretd ewretd sprtrn 
19700102 0.000686 0.012137 0.033450 0.010211 


19700109 -0.001353 -0.002797 -0.002923 -0.003021 
ew=abs (daSvwretd) 


obtain Geweke-Port-Hudak estimate using command fdGPH 


i #2# 





> m3=fdGPH (ew) 
> m3 
sd 
[1] 0.3722260 
$sd.as 
[1] 0.0698385 
Ssd.reg 
[1] 0.06868857 
% Maximum likelihood estimation of an AFRIMA(1,d,1) model. 
> m2=fracdiff (ew, nar=1,nma=1) 
> summary (m2) 
Call: 
Fracdiff(x = ew, nar = 1, nma = 1) 


Coefficients: 

Estimate Std. Error z value Pr(>|z|) 
d 0.490938 0.007997 61.39 <Ze-16 *** 
ar 0.113389 0.005988 18.94 <2e-16 *** 
ma 0.575895 0.005946 96.85 <2e-l16 *** 


[d.tol = 0.0001221, M = 100, h = 0.0003742] 
Log likelihood: 3.551e+04 ==> AIC = -71027.02 [1 deg. freedom] 


2.12 ”模型 比较 和 平均 


在 实际 应 用 中 ， 对 于 一 个 给 定时 间 序列 来 说 完全 正确 的 模型 是 不 存在 的 ， 所 有 的 统计 模 
型 都 只 能 估计 数据 的 动态 相关 性 ， 而 且 适 合 给 定数 据 的 拟 合 模型 不 止 一 个 ， 这 样 ， 就 会 产生 
多 个 模型 如 何 比较 的 问题 ， 本 节 中 ， 我 们 将 介绍 比较 时 间 序列 模型 的 两 种 方法 ， 这 两 种 方法 
都 属于 统计 准则 ， 它 们 提供 了 模型 选择 的 一 些 规则 ， 然 而 ， 它 们 也 只 是 一 些 参 考 规则 ， 事 实 
上 ， 在 选择 模型 时 数据 分 析 的 目的 和 所 考虑 问题 的 实际 信息 都 是 要 考虑 的 重要 因素 


2.12.1 样本 内 比较 


如 打数 据 分 析 的 目的 是 为 了 研究 一 个 时 间 序 列 的 动态 结构 ， 那 么 我 们 可 以 用 样本 内 方 
法 来 比较 不 同 的 模型 ， 样本 内 法 就 是 利用 所 有 数据 来 进行 模型 估计 和 比较 这样， 信息 准 
则 (如 AIC 和 BIC) 和 残 差 方差 的 仿 计 都 可 用 来 进行 模型 比较 ， 如 末 选 定 其 中 一 个 准则 ， 那 
么 它 的 值 越 小 ， 模 型 就 越 好 . 例如， 考虑 CRSP Decile 1 指数 从 1970 年 1 月 到 2008 年 12 
的 数据 ， 我 们 利用 例 2.7 中 的 季 市 ARMA 模型 和 1 月 为 哑 变 量 的 回归 模型 ,对 于 该 回归 栋 
型 ， 残 差 的 标准 误差 是 0.069， 而 在 季节 ARMA 模型 中 该 值 为 V0. 004 72 一 0.0687. 如 果 
样本 内 比较 法 把 残 差 的 标准 误差 作为 模型 选择 标准 ， 那 么 驶 会 选择 季 和 ARMA 模型 .对 
于 这 个 例子 ， 这 两 个 模型 间 的 差别 很 小 . 


2. 12.2 样本 外 比较 

















大 建立 时 间 序 列 模型 是 为 了 预测 ， 那 么 进行 模型 比较 就 要 考虑 模型 的 预测 能 力 . 在 进 
行 样 本 外 比较 时 ， 一般 用 预测 误差 的 均 方 (Mean Square of Forecast Error，MSFE) 来 量化 
模型 的 预测 能 力 . 这 种 模型 比较 的 方法 在 金融 文献 中 叫做 回 测 检验 (backtesting). 我 们 利 
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用 超前 1 步 预测 来 介绍 这 种 方法 . 不过， 该 方法 对 超前 多 步 预 测 也 适用 . 

回 测 检验 

统计 模型 回 测 检验 的 步骤 如 下 : 

1) 将 数据 集 分 割 为 佑 计 子 样本 和 预测 子 样本 . 这 里 没有 具体 的 指导 准则 ,但 是 每 一 个 
于 样本 要 包含 足够 多 的 数据 点 ， 确 保佑 计 和 MSFE 的 计算 尽 可 能 准确 . 

2) 用 估计 子 样本 中 的 数据 进行 估计， 利用 拟 合 模 型 得 到 超前 TE) A iR 
Fe. 具体 地 ， 我 们 假设 估计 子 样本 是 4z, | 上 王 1，…，A)}， 用 前 于 个 数据 点 来 计算 超前 1 步 
预测 Zz, (1) 和 它 的 预测 误差 w (1) 二 zt1 一 ZX (1)， 模 型 估计 过 程 中 没有 用 到 数据 点 Cra. 

3) 对 佑 计 子 样本 添加 一 个 新 的 数据 点 ， 变 为 4z [t= 1, ot, Al). 用 前 有 十 1 个 数据 操 
重新 估计 模型 ， 计 算 超 前 1 步 预测 和 它 的 预测 误差 .也 就 是 ， 计 算 e+ C) S drt 一 Zr1(1)， 
FOP Dn OEA AHL 为 预测 原点 的 新 拟 合 模型 的 超前 1 步 预 测 . 

4) 重复 步 又 3)， 下 到 超前 1 步 预测 误差 为 er-1(1) 二 xr 一 Xr-1(1)， 醋 为 样本 量 . 

那么 ， 模 型 的 MSFE 是 








Se, (1) } 


其 中 om 表示 所 用 的 模型 .我 们 把 最 小 MSFE 对 应 的 模型 作为 这 组 数据 的 最 好 模型 ， 在 实际 
中 ， 我 们 用 MSFE 的 平方 根 ， 而 不 是 MSFE 5G. 度量 模型 预测 能 力 的 其 他 度量 有 平均 绝 
对 预测 误差 (Mean absolute Forecast Error，MAFE) 和 偏差 (Bias)， 它 们 分 别 定 义 为 : 








gal T-1 


DUAD Sa 
MAFE(m) = ic as ， Bias(m) = Fy 
Fil 2.9 考虑 从 1947 年 第 1 季度 到 2010 年 第 2 季度 的 美国 季度 实际 GDP. GDP 数据 来 
源 于 圣路易斯 (St Loius) 联 邦 储备 银行 (Federal Reserve Bank), 已 做 了 季度 调整 ， 以 2005 年 
GDP 为 基础 进行 通胀 调整 ， 以 10 亿美 元 为 单位 (billions of chained 2005 dollars). 图 2-32 表明 
Real GDP 








In (gdp) 
7.5 9.0 
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Year 
a) 实际 GDP 的 对 数值 


Growth rate 


1950 1960 1970 1980 1990 2000 2010 
Year 


b) GDP 的 增长 率 
图 2-32 从 1947 年 第 1 季度 到 2010 年 第 2 季度 美国 实际 季度 GDP 的 时 序 图 
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实际 季度 GDP 的 对 数值 和 增长 率 序 列 . 我 们 关注 的 是 增长 率 友 列 ， 记 为 zx, 图 2-33 显示 了 
x, 的 样本 ACF 和 PACF. 从 这 个 图 可 以 看 出 ， 它 们 衰减 的 速度 很 快 ，PACF 说 明 该 数据 可 以 用 
AR(3) 模 型 ， 利 用 R 语言 中 的 ar 命令 获取 的 AIC 值 也 表明 ，AR(3) 模 型 较 好 .， 拟 合 的 模型 为 : 
(1—0. 346B—0. 130B’ + 0. 123B°) (x, 一 0.0079) = a, & =8.32X10° (2-52) 
其 中 估计 的 标准 误差 依次 分 别 是 0.062, 0.066, 0.062 和 0.0009. WEA AR(3) 模 型 的 AIC 是 
— 1648. 45。 图 2-34 表明 AR(3) 模 型 的 模型 检验 统计 量 . 这 些 图 可 以 说 明 AR(3) 模 型 是 充分 的 . 
Series dgdp 
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图 2-33 美国 从 1947 年 第 2 季度 到 2010 年 第 2 季度 的 季度 实际 GDP 增长 率 的 样本 ACF H PACF. 
虚线 表示 两 个 标准 误差 的 上 下 限 
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图 2-34 从 1947 年 第 2 季度 到 2010 年 第 2 季度 美国 的 实际 季度 GDP 增长 率 的 拟 合 
AR(3) 模 型 的 检验 
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由 于 数据 已 做 了 季节 调整 ， 所 以 为 了 进行 模型 比较 ， 我 们 也 使 用 季节 模型 
(1 — 0. 331B — 0. 152B? 十 0. 110B*) (1 一 0. 497B4)(z — 0. 0079) = (1 一 0.587B4)a， 
(2-53) 

其 中 估计 的 标准 误差 分 别 是 0.063、0. 067、0. 064、0. 258 、0. 0008 和 0. 236 ， 残 差 方 差 是 
g =8. 24X10 °. EP AR 参数 仅仅 略微 显著 .模型 检验 不 能 说 明 拟 合 的 季节 模型 不 充分 
性 ， 模 型 ( 式 (2-53)) 的 AIC 是 一 1646. 93. 图 

现在 ,我们 对 式 (2-52) 和 式 (2-53) 的 模型 进行 比较 . 用 样本 内 比较 法 ，AIC 选择 
AR(3) 模 型 ， 用 样本 外 法 进行 比较 ， 以 2000 年 第 四 季度 为 预测 原点 ， 按 照 回 测 检 验 的 步 
又 ， 在 预测 时 间 段 内 有 38 个 季度 . 对 于 超前 1 步 预测 来 说 ，AR(3) 模 型 和 季节 模型 的 预测 
误差 的 平方 根 分 别 为 0.006 15 和 0.006 32， 这 说 明 AR(3) 模 型 更 好 . 平均 绝对 预测 误差 分 
别 是 0. 004 43 和 0. 004 55， 这 也 说 明 AR(3) 模 型 比 季 节 模 型 好 . 

最 后 ， 上 例 中 ， 对 于 实际 GDP 增长 率 序 列 来 说 ， 样 本 内 和 样本 外 法 都 选择 了 同一 个 
AR(3) 模 型 .在 实际 应 用 中 ， 样 本 内 和 样本 外 法 可 能 会 选择 不 同 的 模型 ， 初 始 预测 原点 的 
选取 也 可 能 影响 模型 的 选择 结果 . 因此 ， 我 们 建议 选取 不 同 的 初始 预测 原点 进行 比较 ， 以 
便 更 好 地 理解 模型 比较 的 结果 . 

注 记 : 例 2.9 的 回 测 检验 是 用 RR 脚本 packtest 来 实现 的 ， 可 以 在 本 书 的 网 站 下 载 . 
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R 代码 演示 
= da=read.table("q-gdpc96.txt",header=T) 
> head(da) 


Year Mon Day gdp 
1 1947 1 1 1772.204 


1948 4 1 1856.930 
> gdp=log(da$gdp) 
> dgodp=diff (gdp) 


mn 


> ml=ar(dgdp,method=‘mle’ ) 
> mlSorder 


[1]. 3 
> młž=arima (dgdp, order=c(3,0,0)) 
> m2 
Coefficients: 
arl ar? ar3 intercept 
0.3462 0.1299 -0.1225 0.0079 
s.e. 0.0623 0.0655 0.0624 0.0009 


sigma^2 estimated as 8.323e-05: log likelihood=829.23, aic=-1648.45 


> m3=arima (dgdp, order=c(3,0,0),season=list (order=c(1,0,1),period=4)}! 


> m3 
Coefficients: 
arl ar2 ar3 sarl smal intercept 
0.3305 0.1521 -0.1103 0.4966 -0.5865 0.0079 


s.e. 0.0633 0.0668 0.0635 0.2578 0.2357 0.0008 


一 Z 2# 





sigma*2 estimated as 8.24e-05: log likelihood=830.47, aic=-1646.93 
> 

> source("backtest.R") % Perform backtest 

> mmZ=backtest (m2,dgdp,215,1) 

[1] "RMSE of out-of-sample forecasts" 

[1] 0.006153102 

[1] "Mean absolute error of out-of-sample forecasts" 
[1] 0.004430387 

> mm3=backtest (m3, dgdp,215,1) 

[1] "RMSE of out-of-sample forecasts" 

[1] 0.006322009 

[1] "Mean absolute error of out-of-sample forecasts” 
[1] 0.004553896 


2.12.3 模型 平均 


当 有 多 个 模型 可 以 很 好 地 拟 合 给 定 的 时 间 序 列 数 据 时 ， 我 们 除了 从 中 选择 茶 个 模型 
外 ， 也 可 以 利用 所 有 这 些 模 型 产生 一 个 组 合 预 测 . 这 种 技术 在 统计 文献 中 叫做 模型 平均 
(model averaging). 假设 有 mm 个 可 用 模型 它们 都 能 给 出 一 个 时 间 序 列 的 无 偏 预 测 . 这 里 
无 偏 预 测 是 指 相关 联 的 预测 误差 的 期 望 为 0. 令 zti 是 模型 i 在 预测 原点 h RT LT 
测 ， 那 么 组 合 预测 可 定义 为 





m 
Lhi = >) w; Xj h+l 
i=1 


其 中 w 是 一 个 非 负 实数 ， 表 示 模型 的 权重 ,满足 Dw = 1 .权重 w 可 以 通过 多 种 广 
式 来 确定 ， 比如， 在 贝 叶 斯 推断 中 ，w; 是 模型 i 的 后 验 概率 ， 这 里 ， 我 们 采用 简单 平均 ， 


即 wi 一 二 ， 有 限 的 经 验 表 明 ， 这 种 简单 平均 在 实际 中 很 有 效 . 
习题 


除非 特别 声明 ， 在 以 下 习题 中 都 用 5% 的 显著 性 水 平 来 得 出 结论 . 
1. 考虑 从 1948 年 1 月 到 2011 年 11 月 美国 失业 率 的 月 数据 ( 见 文件 m-unrate-4811. txt)， 数 据 来 自 美国 
圣路易斯 的 联邦 储备 银行 . 
(a) 该 失业 率 的 月 数据 是 否 存在 单位 根 ? 为 什么 ? 
Cb) 根据 该 数据 建立 一 个 时 间 序 列 模型 并 检验 模型 是 
美国 2011 Æ 12 月 和 2012 年 前 3 个 月 的 失业 率 进 
要 模型 充分 即 可 . ) 
Co) 拟 合 的 模型 是 否 存 在 商业 周期 ?” 为 什么 ? 
































否 已 充分 拟 合 数据 然后， 根据 所 建立 的 模型 对 
行 预测 . GER: 适合 该 数据 的 模型 不 止 一 个 ， 只 











2. 以 NYSE/AMEX/NASDAQ 的 市 场 资 本 为 基础 考虑 CRSP Decile 1、2、5、9、10 投资 组 合 的 月 简单 收 


益 认 .该 数据 的 时 间 区 间 是 从 1961 年 1 月 到 2011 年 9 月 . 

(a) 对 于 Decile 2 和 Decile 10 的 收益 序列 ， 在 5% 的 显著 性 水 平 下 检验 : 原 假设 是 滞后 阶 数 为 1 一 12 的 
和 目 相 关系 数 均 为 0， 给 出 你 的 结论 . 

(b) 对 于 Decile 2 的 收益 率 序列 建立 一 个 ARMA 模型 ， 对 模型 进行 检验 并 写 出 拟 合 的 模型 ， 

Co) 利用 拟 合 的 ARMA 模型 对 序列 进行 超前 1 一 12 步 预测 ， 并 给 出 预测 的 相关 标准 误差 . 
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3. ZE 2007 Æ 1 H 2 A Bl) 2011 12 H 23 HWE, 苹果 公司 股票 每 天 的 股价 波动 幅度 ( 即 当 天 的 最 高 
价 减 去 当天 的 最 低 价 )， 这 个 数据 可 以 用 R 添加 包 quantmod 从 雅虎 财经 获得 .计算 这 个 时 间 序 列 开 
te 100 dita Hay ACF 值 ， 存 在 长 范围 相依 的 证 据 吗 ? 为 什么 ?” 如果 这 个 数据 存在 长 记忆 ， 请 建立 该 
数据 的 ARIMA 模型 . 

4. 考虑 Moody 公司 Aaa 和 Baa 级 季度 债券 从 1919 年 1 月 到 2011 年 11 月 的 月 收益 率 . 该 数据 源 于 美国 圣 
路 易 斯 联邦 储备 银行 的 FRED. 考虑 Aaa 债券 的 月 对 数 收益 率 序 列 ， 建 立时 间 序 列 模型 并 对 模型 进行 
检验 . 

5. 继续 考虑 Aaa 债券 的 月 对 数 收益 序列 ， 利 用 指数 平滑 法 求 超前 1 一 12 步 的 样本 外 预测 ， 预测 原点 是 
2010 年 11 月 . 

6. 考虑 前 面 所 讨论 的 两 个 便 券 的 收益 率 序 列 ， 它 们 之 间 存 在 什么 关系 ? 为 了 回答 这 个 问题 ， 首 先 对 数据 
取 对 数 ， 然 后 利用 Baa 级 债券 的 收益 率 作 为 解释 变量 ， 建 立 Aaa 级 债券 收 益 率 数据 的 时 间 序 列 模型 . 
写 出 拟 合 的 模型 并 对 模型 进行 检验 ， 

7. 考虑 强生 (Johnson&.Johnson) 公 司 股 票 从 1992 年 第 1 季度 到 2011 年 第 2 季度 每 股 季度 收益 数据 ， 文 本 
文件 g-jnj-earns-9211. txt 中 的 数据 来 源 于 Thomson Reuters 的 Fisrt Call Historical Database. 如果 
需要 可 以 对 数据 取 对 数 ， 建 立时 间 序 列 模型 并 进行 模型 检验 ， 写 出 所 拟 合 的 模型 ， 利 用 1992 年 到 2008 
年 的 数据 重新 进行 拟 合 ， 并 写 出 季度 收益 的 超前 1 一 10 步 预测 ， 画 出 预测 值 的 时 序 图 . 

8. 考虑 美国 从 1947 年 第 1 季度 到 2011 年 第 3 季度 的 季度 实际 GNP, 该 数据 存放 于 文件 q-GNPC96. txt 
中 ， 数 据 已 做 了 季节 调整 ， 以 2005 年 GNP 为 基础 进行 了 通胀 调整 ， 以 10 亿美 元 为 单位 (billions of 
chained 2005 dollars). 假设 x, 代表 GNP 增长 率 的 时 间 序 列 数据 . 

(a) 通过 ar 命令 ， 应 用 AIC HEM, ATW x, 识别 一 个 AR(4) 模 型 ， 拟 合 这 个 模型 ， 拟 合 的 模型 充分 
吗 ? 为 什么 ? 

Cb) 数据 x, 的 样本 PACF 识别 的 是 AR(3) 时 间 序 列 模型 . 拟 合 这 个 模型 ， 拟 合 的 模型 充分 吗 ?” 为 
TA? 

Co) 如果 用 样本 内 法 进行 比较 ， 哪 个 模型 好 ?为 什么 ? 

Cd) 以 2004 年 第 4 季度 为 预测 原点 ， 把 数据 分 为 估计 样本 和 预测 样本 ， 应 用 回 测 检验 ， 并 以 MSFE 为 
标准 ， 为 x, 选择 一 个 模型 ， 并 给 出 选择 该 模型 的 理由 . 
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